Programmation 

Python 

Conception et optimisation 



2 e edition 



Tarek Ziade 

Preface de 
Stephan Richter 



EYROLLES 



Programmation 

Python 



CHEZ LE MEME EDITEUR 



R. Goetter. - CSS2. Pratique du design web. 
N°12461, 3 e edition, 2009, 318 pages. 

L. Jayr. - Flex 3 - Cahier du programmeur. 

N° 12409, 2009, 280 pages. 

A. Vannieuwenhuyze. - Flex 3. Applications Internet riches 
avec Flash ActionScript 3, MXML et Flex Builder. 
N°12387, 2009, 532 pages. 

G. Leblanc. - Silverlight 2. 

N°12375, 2008, 330 pages. 

G. Poncon et J. Pauli. - Zend Framework. 

N°12392, 2008, 460 pages. 

E. Daspet et C. Pierre de Geyer. - PHP 5 avance. 
N°12369, 5 e edition, 2008, 844 pages. 

C. Porteneuve. - Bien developper pour le Web 2.0. 

N°12391, 2 e edition 2008, 600 pages. 

A. Boucher. - Ergonomie web. Pour des sites web 

ejficaces. 

N° 12479, 2 e edition 2009, 426 pages. 

A. Boucher. - Memento Ergonomie web. 

N°12386, 2008, 14 pages. 

E. Sloim. - Sites web. Les bonnes pratiques. 
N° 12456, 2009, 14 pages. 

A. Tasso. - Apprendre a programmer en ActionScript. 

N°12199, 2007, 438 pages. 

S. Bordage, D. Thevenon, L. Dupaquier, F. 
Brousse. - Conduite de projets Web. 

N°12325, 4 e edition 2008, 394 pages. 

N. Chu. - Reussir un projet de site Web. 

N°12400, 5 e edition ,2008, 246 pages. 

O. Andrieu. - Reussir son referencement web. 

N° 12264, 2008, 302 pages. 



G. Poncon. - Best practices PHP 5. Les meilleures pratiques 
de developpement en PHP. 
N°11676, 2005, 480 pages. 

D. Seguy, P. Gamache. - Securite PHP 5 et MySQL. 
N° 12114, 2007, 240 pages. 

R. Rimele. - Memento MySQL. 

N°12012, 2007, 14 pages. 

M. Nebra. - Reussir son site web avec XHTML et CSS. 

N°12307, 2 e edition, 2008, 316 pages. 

J.-M. Defrance. - Premieres applications Web 2.0 avec 
Ajax et PHP. 

N°12090, 2008, 450 pages (Collection Blanche). 

K. Djaafar. - Developpement JEE 5 avec Eclipse Europa. 

N° 12061, 2008, 380 pages. 

S. Powers. - Debuter en JavaScript. 

N°12093, 2007, 386 pages. 

T. Templier, A. Gougeon. - JavaScript pour le Web 2.0. 

N°12009, 2007, 492 pages. 

D. Thomas et al. ~ Ruby on Rails. 
N° 12079, 2 e edition 2007, 800 pages. 

W. Altmann et al. - Typo3. 
N°11781, 2006, 532 pages. 

L. Bloch, C. Wolfhugel. - Securite informatique. 

Principes fondamentaux pour I 'administrates systeme. 
N°12021, 2007, 350 pages. 

G Gete. - Mac OS X Leopard efficace. Deploiement, 
administration et reparation. 
N°12263, 2008, 476 pages. 

M. Mason. - Subversion. Pratique du developpement 
collaboratif avec SVN. 
N°11919, 2006, 206 pages. 



Programmation 

Python 

Conception et optimisation 



Tarek Ziade 



Preface de Stephan Richter 



2 e edition 



EYROLLES 

• 



EDITIONS EYROLLES 

61, bd Saint-Germain 

75240 Paris Cedex 05 

www.editions-eyrolles.com 



Avec la contribution de Patrick Tonnerre. 




DANGER Le code de la propriete intellectuelle du l el juillet 1992 interdit en effet expressement la photocopie a 
usage collectif sans autorisation des ayants droit. Or, cette pratique s'est generalisee notamment dans les 
etablissements d'enseignement, provoquant une baisse brutale des achats de livres, au point que la possibilite 
meme pour les auteurs de creer des ceuvres nouvelles et de les faire editer correctement est aujourd'hui 
menacee. 
En application de la loi du 11 mars 1957, il est interdit de reproduire integralement ou partiellement le 

present ouvrage, sur quelque support que ce soit, sans autorisation de Fediteur ou du Centre Francais d' Exploitation du 

Droit de Copie, 20, rue des Grands-Augustins, 75006 Paris. 

© Groupe Eyrolles, 2006, 2009, ISBN : 978-2-212-12483-5 



PHOTOCOPILLAGE 
TUELELIVRE 



AAmina etMllo 



Choisir Python 



Par Stephan Fuehrer 



J'ai commence la programmation avec un Commodore 64 (C64), un petit systeme 
base sur le langage de programmation Basic, qui est a la fois simple et puissant. J'ai 
eu par la suite un PC dote de Borland Pascal. Le systeme d'aide en ligne de Pascal est 
tres impressionnant : chaque commande et bibliotheque est parfaitement docu- 
mented et accompagnee bien souvent d'exemples de code. Ce systeme permet une 
maitrise rapide du langage. De plus, le Pascal permet d'integrer des sequences 
d'assembleur, pour programmer par exemple directement la souris et le joystick. Le 
seul defaut du Pascal est la compilation obligatoire, qui est un peu ennuyeuse pour 
quelqu'un venant du Basic. 

Par la suite, Jason Orendorff, pionnier de la communaute Python et laureat 2001 du 
Concours international d'obfuscation de code C (IOCCC) est devenu mon mentor et 
m'a appris toutes les techniques avancees de programmation, comme la programma- 
tion orientee objet par le biais de Java, langage particulierement ordonne et propre. 
Mais cette proprete a un prix : 1' effort supplemental pour ecrire un programme Java 
dans les regies de Fart est trop important. II faut toujours ecrire des classes, et une 
seule par fichier, puis compiler, etc. Jim Fulton parle de programmation « javiotique » 
pour decrire ce surcroit d'effort. 

Jason m'a alors converti a Python. Apres une periode d'adaptation, on tombe tres vite 
amoureux de ce langage. Aucune compilation n'est necessaire et Python est utilisable 
sur tant de plates-formes qu'il est plus portable que Java. De plus, Python permet de 
programmer objet mais ne l'impose pas : il reste possible de faire des petits scripts 
destructures. Youpi ! Enfin, l'indentation obligatoire du code ne pouvait que satis- 
faire mes genes prussiens. 

Que peut-on esperer de mieux ? Des fonctionnalites ! Pour un developpeur issu du 
monde Pascal, le passage a des langages comme Java ou C++ est frustrant a cause de 
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la pauvrete des bibliotheques standards. La philosophic batteries included de Python 
offre tout ce dont un developpeur peut rever. 

Un autre avantage de Python est la richesse des bibliotheques tierces. Comme 
Python est utilise dans la quasi-totalite des domaines et a tous les niveaux applicatifs, 
il existe des extensions pour toutes les fonctionnalites que Ton peut imaginer. Vous 
souhaitez faire du calcul scientifique ? Utilisez l'extension numeric. Vous avez du 
code MatLab a integrer ? Installez l'extension matlab pour pouvoir piloter ce moteur 
depuis Python. Le langage est aussi utilise pour les frameworks web comme Zope et 
Plone, les moteurs de jeu comme Pygame, les plug-ins pour Gimp et toute une 
myriade d'applicatifs. Cette variete prouve la puissance de Python, qui s'adapte aussi 
bien aux situations ou seul un langage de script est necessaire, que pour des besoins 
plus complets, faisant appel a la programmation orientee objet. 

J'ai decouvert par la suite la communaute Python et plus generalement la mouvance 
open source. Ma premiere contribution etait un correctif dans un exemple pour une 
bibliotheque d'envois d'e-mails. Guido von Rossum m'a personnellement repondu 
pour me signaler que mon correctif serait integre dans la prochaine release. L'Open 
Source, quel bonheur ! 

Une communaute autour d'une technologie fait toute la difference : le niveau d'assis- 
tance est incroyable et les questions obtiennent des reponses en general en quelques 
heures. Quel logiciel proprietaire offre ce genre de service gratuitement ? Ce systeme 
permet d'avancer sans jamais etre bloque, et les developpeurs qui acquierent leur 
experience par ce biais renvoient souvent l'ascenseur a la communaute en repondant 
a leur tour aux questions des autres. 

J'ai decouvert par la suite Zope, le serveur d' applications ecrit en Python. La decouverte 
de Zope provoque le meme effet que celle de Python : « wow ! ». Zope offre toutes les 
fonctionnalites revees pour une application web, comme la securite et la persistance, 
ainsi que de nombreuses extensions. Quel plaisir, compare a des frameworks comme 
IBM WebSphere et BEA Weblogic. 

Durant les quatre dernieres annees, j'ai fait partie des core developers de Zope 3, qui 
est une recriture complete de Zope, basee sur l'experience passee des versions 1 et 2. 
Ce projet est passe du rang de prototype educatif a ce qu'il est aujourd'hui : une 
application utilisee en production par des entreprises pour des projets web critiques. 
Zope 3 est considere comme la plus stable et la plus sure des plates-formes web open 
source disponibles a l'heure actuelle, grace aux milliers de tests unitaires et fonction- 
nels qui ont ete codes en parallele de sa conception. Les performances sont egale- 
ment au rendez-vous : Zope 3 peut etre configure pour ne fournir que les services 
utilises dans un applicatif donne, et reste tres performant compare aux frameworks 
capables de fournir la meme quantite de fonctionnalites. 
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Mais que pouvez-vous faire avec Zope 3 ? Le premier projet a avoir officiellement uti- 
lise Zope 3 est Schooltool, un outil gratuit de gestion d'ecole dans lequel je suis egale- 
ment investi. Schooltool fournit de nombreuses fonctionnalites, de la generation de 
rapports PDF aux calendriers en ligne. Beaucoup d'ecoles ont d'ores et deja adopte 
Scholltool ainsi que son petit frere SchoolBell, et demontrent le succes de cet outil. 
Pour l'annee a venir, SchoolTool a deja signe avec de nombreux partenaires du monde 
de l'education, avec pour objectif de remplacer petit a petit les solutions proprietaires, 
ce qui constitue un premier signe de l'entree de la solution sur ce marche. Le projet est 
finance par la Shuttleworth Foundation, et Mark Shuttleworth ne risquerait pas un cen- 
time sur une technologie qui ne marcherait pas ou ne pourrait pas grandir. 

Cela fait maintenant six ans que je gagne ma vie en developpant du code Python 
open source et c'est un veritable bonheur ! Je ne voudrais jamais, quelque fut le prix, 
travailler pour une entreprise qui ne me laisserait pas ecrire du code open source 
Python. Dans mon autre vie, je suis un doctorant en physique, et meme si les publi- 
cations de recherche sont ouvertes a tous, le secret qui entoure le travail de recherche 
m'oppresse souvent, en comparaison a mes travaux dans le monde de l'open source. 

Merci pour votre lecture et regalez-vous avec ce livre ! 

Sincerement, 

Stephan 
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Avant-propos 



« wOOt! I know Python! » 

: Wow ! Je maitrise Python maintenant ! » 

— Neo, retirant son casque 



Ce livre traite de Python, un langage de programmation de haut niveau, oriente objet, 
totalement libre et terriblement efficace, concu pour produire du code de qualite, por- 
table et facile a integrer. Ainsi la conception d'un programme Python est tres rapide et 
offre au developpeur une bonne productivite. En tant que langage dynamique, il est 
tres souple d'utilisation et constitue un complement ideal a des langages compiles. 

II reste un langage complet et autosuffisant, pour des petits scripts fonctionnels de quel- 
ques lignes, comme pour des applicatifs complexes de plusieurs centaines de modules. 



Pourquoi ce livre 



II existe deja de nombreux ouvrages excellents traduits de l'anglais qui traitent de 
Python voire en presentent l'integralite des modules disponibles. Citons Python en 
concentre, le manuel de reference de Mark Lutz et David Ascher, aux editions 
O'Reilly, ou encore Apprendre a programmer avec Python de Gerard Swinnen, aux 
editions Eyrolles, inspire en partie du texte How to think like a computer scientist 
(Downey, Elkner, Meyers), et comme son titre l'indique, tres pedadogique. 

Alors, pourquoi ce livre ? 
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Si ce livre presente comme ses predecesseurs les notions fondamentales du langage, avec 
bien sur des exemples originaux, des choix dans la presentation de certains modules, et 
une approche globale particuliere, il tente egalement d'ajouter a ce socle des elements 
qui participent de la philosophic de la programmation en Python, a savoir : 

• des conventions de codage ; 

• des recommandations pour la programmation dirigee par les tests ; 

• des bonnes pratiques de programmation et des techniques d'optimisation ; 

• des design patterns orientes objet. 

Meme si chacun de ces sujets pourrait a lui seul donner matiere a des ouvrages 
entiers, les reunir dans un seul et meme livre contribue a fournir une vue complete de 
ce qu'un developpeur Python averti et son chef de projet mettent en oeuvre quoti- 
diennement. 



A qui s'adresse l'ouvrage ? 

Cet ouvrage s'adresse bien sur aux developpeurs de tous horizons mais egalement aux 
chefs de projets. 

Les developpeurs ne trouveront pas dans ce livre de bases de programmation ; une 
pratique minimale prealable est indispensable, quel que soit le langage utilise. II n'est 
pour autant pas necessaire de maitriser la programmation orientee objet et la con- 
naissance d'un langage imperatif est suffisante. 

Les developpeurs Python debutants - ou les developpeurs avertis ne connaissant pas 
encore ce langage - trouveront dans cet ouvrage des techniques avancees, telles que la 
programmation dirigee par les tests, les patterns efficaces et Implication de certains 
design patterns objet. 

Les chefs de projets trouveront des elements pratiques pour augmenter l'efficacite de 
leurs equipes, notamment la presentation des principaux modules de la bibliotheque 
standard -pour hitter contre le syndrome du NIH {Not Invented Here) -, des con- 
ventions de codage, et un guide explicite des techniques de programmation dirigee 
par les tests. 
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Guide de lecture 

Le livre est decoupe en quatre parties qui peuvent etre lues de maniere relativement 
independante, en fonction des besoins. 

La premiere partie presente une introduction au langage, decrit les differents 
domaines d'utilisation de Python, ainsi que la mise en place d'un environnement de 
developpement ; elle s'adresse principalement aux lecteurs qui decouvrent Python. 

La deuxieme partie est consacree a la presentation du langage, de la syntaxe aux con- 
ventions de codage, en passant par les primitives. C'est un referentiel complet utile 
en toutes circonstances. 

La troisieme partie presente les modules de la bibliotheque standard les plus fre- 
quemment utilises, pour ne pas rechercher ailleurs ce qui est deja disponible. Cette 
partie s'acheve sur une petite serie d'exercices. 

Enfin, la quatrieme partie regroupe les techniques avancees, a savoir la programma- 
tion dirigee par les tests, les bonnes pratiques et techniques d'optimisation, et enfin 
des techniques de programmation orientee objet. 

Ce livre s'acheve par une serie d'annexes qui presentent l'histoire de Python, une liste 
de bibliotheques tierces, une liste de sites, blogs, et autres sources d'information de la 
planete Python. 
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ARTHUR : 

Lancelot ! Lancelot ! Lancelot ! 

[megaphone de police] 

Lancelooooooooot ! 
LANCELOT: 

Bloody hell, mals que se passe- t-ll done, mon Rot ? 
ARTHUR : 

Bevedere, expllque-lul ! 
BEVEDERE : 

Nous devons teparler d'un nouveau langage de programmation : Python 

LANCELOT: 

Nouveau ? Celafait blen dlx ans qu'il exlste, etje ne vols pas en quol cela va nous 
alder a recuperer le Salnt-Graal ! 

BEVEDERE : 

Salnt-Graal, Salnt-Graal... 

[soupir] 

Tu ne peux pas penser a des actlvltes plus salnes que cette quite stuplde de temps en 
temps ? 

ARTHUR : 

[sort une massue et assomme Bevedere avec] 

Son explication etalt mal partle de toute manlere. 
GARDES FRANCAIS : 

Est-ce que ces messieurs les Anglais peuvent aller s'entretuer plus loin ? 

Ne voyez-vous pas que nous sommes concentres sur notrejeu en llgne ? 
ARTHUR : 

Ce tunnel sous la Manche, quelle heresle ! 

[rack sa gorge] 

Lancelot, assleds-tol, et ecoute-mol. (et ferme ce laptop, bloody hell!) 
LANCELOT: 

[rabat l'ecran de son laptop] 
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ARTHUR : 

La quite a change. Tu dois maintenant apprendre le langage Python, 

et decouvrir pourquoi il est de plus en plus prise par mes sujets. 
LANCELOT: 

Mais... 
ARTHUR : 

II n'y a pas de mals ! 

[menace Lancelot avec sa massue] 

Je suls ton Rot. dot slash. 

Prends ce livre, et au travail ! 
GARDES FRANCAIS : 

Oui, au travail, et en silence ! 



Premiere partie 



Decouverte de 
Python 

Cette premiere partie, qui est tres courte, contient trois chapitres dedies a la 
decouverte de Python. 

Le premier chapitre est une introduction au langage, qui detaille les caracteristiques 
presentees dans l'avant-propos, et renvoie le lecteur vers les chapitres consacres, 
puis effectue une comparaison avec d'autres languages. 

Pour completer cette introduction, le deuxieme chapitre presente les domaines 
d'utilisation les plus courants de Python. 

Enfin, le dernier chapitre couvre la mise en place d'un environnement de 
developpement, de l'installation du langage au choix d'un editeur. 

Mettre en place un environnement de developpement agreable conditionne la 
lecture de la suite du livre : de nombreuses portions de code sont fournies et avoir 
un prompt et un editeur a portee de main permet de les tester directement. 
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Introduction 



Python — why settle for snake oil when you can have the whole snake ? 

« Python - Pourquoi se contenter d'huile de serpent quand 
on peut avoir le serpent tout entier ? » 

Mark Jackson 



En guise d'introduction, ce premier chapitre presente quelques caracteristiques de 
Python et renvoie aux chapitres consacres. S'ensuit une comparaison avec d'autres 
langages. Le souhait n'est pas d'etre exhaustif, mais plutot de situer Python dans 
l'esprit des developpeurs familiers avec d'autres langages. 



Python ? 



Pour reprendre l'enonce de l'avant-propos, Python est un langage : 

• concu pour produire du code de qualite, portable et facile a integrer ; 

• de haut niveau, oriente objet et totalement libre ; 

• hautement productif ; 

• dynamique. 
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Du code de qualite 

Grace a sa syntaxe claire, coherente et concise, presentee au chapitre 4, Python 
permet aux developpeurs de produire du code de qualite, lisible et maintenable. 
Ecrire du code Python est un exercice agreable, meme en respectant les conventions 
de codage, presentees au chapitre 7. 

Fourni des le depart avec des modules de tests, Python est un langage agile. Le terme 
agile est originellement issu de la methodologie de programmation agile (Beck et 
AL), tres proche de la programmation iterative. Cette methodologie, qui reduit les 
risques lies a la conception de logiciels, introduit entre autres des principes de tests 
continus du code. 



► http://www.agilemanifesto.org 



Le chapitre 12 presente les techniques de programmation dirigee par les tests appli- 
quees a Python. 



Oriente objet 



Meme si elle n'est pas imposee, Python permet la programmation orientee objet. 
Tous les mecanismes objet essentiels sont implemented et toutes les donnees mani- 
pulees sont des instances de classes, comme pour les langages SmallTalk ou Ruby. 

Enfin, le code peut etre structure en modules (fichiers) qui sont ensuite importables 
dans l'interpreteur. Ce decoupage, inspire de Modula-3, permet d'organiser le code 
et son utilisation par des espaces de noms, et aussi de faciliter l'extension du langage 
par des bibliotheques tierces compilees dans d'autres langages. 

Le chapitre 5 explique comment ecrire des classes et structurer le code en modules et 
paquets, et le chapitre 14 presente quelques design patterns (motifs de conception) 
orientes Python. 



Portable 



Python fonctionne sous differentes variantes d'Unix, Windows, Mac OS, BeOs, 
NextStep, et par le biais de differentes implementations. 

Les implementations actuelles de Python sont : 

• Cpython : implementation en C, qui est l'implementation par defaut de Python 
et la plus repandue ; 
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• Jython : implementation en Java, qui permet d'executer du code source Python 
dans un environnement Java, et d'utiliser des modules Java dans le code Python 
de maniere transparente ; 

• PyPy : implementation en Python du langage Python ; 

• IronPython : implementation pour .NET et Mono ; 

• Stackless Python : une variante de CPython, legerement plus rapide. 

II existe bien sur des extensions specifiques a chaque plate-forme, mais l'ensemble 
des primitives du langage et la majorite des extensions de la bibliotheque standard 
sont disponibles sur toutes les plates-formes. En d'autres termes, un programme 
concu sur une plate-forme fonctionnera directement, sauf programmation speci- 
fique, sur d'autres plates-formes. 

CPython, implementation de reference pour cet ouvrage, peut etre installe et utilise 
sous Windows, Mac Os et GNU/Linux (voir chapitre 3). 

Facile a integrer 

Un programme ecrit en Python s'integre tres facilement avec d'autres composants 
logiciels. II est possible par exemple d'utiliser directement des bibliotheques externes 
ou encore d'integrer du code C ou C++ comme l'explique le chapitre 13. 

Hautement productif 

La conception d'applications en Python est tres rapide car certains aspects de pro- 
grammation sont geres automatiquement, comme la gestion des ressources memoire 
et le typage des donnees, decrits au chapitre 4. 

Grace a des types de base tres puissants et des primitives de haut niveau, presentees 
dans le chapitre 6, un programme Python est simple a concevoir et concis. Un pro- 
gramme Python est en general 3 a 5 fois plus court qu'un programme C++ equivalent. 

Ces qualites font de Python un langage ideal dans beaucoup de domaines, comme le 
chapitre 2 le decrit. 

Enfin, la bibliotheque standard de Python est tres complete, et permet de repondre 
aux besoins communs de programmation. Les chapitres 8, 9 et 10 presentent les 
modules les plus frequemment utilises. 

Grace au modele Open Source, la communaute des developpeurs Python est en 
outre tres productive et de nombreuses extensions (voir annexe B) gravitent autour 
du langage 
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Dynamique 



Python est un langage dynamique : dans la plupart des implementations, le code 
source n'est pas compile contrairement a des langages comme C ou Pascal, mais exe- 
cute a la volee. On parle alors de langage interprete. 



Culture Langage interprete et langage compile 

Un langage est dit interprete lorsque le systeme traduit et execute chaque ligne d'un programme a la 
volee. Le resultat d'une modification peut etre constatee en relancant I'execution du programme. 
A I'inverse, un langage compile transforme le programme en une serie d'instructions machine par le biais 
d'une etape de compilation. Celle-ci produit un fichier executable qui est directement comprehensible 
par le processeur. La modification du fichier source necessite de repasser par I'etape de compilation 
avant de pouvoir tester la nouvelle version. 



Ce mode de fonctionnement rend la programmation beaucoup plus souple puisqu'il 
est possible de changer un programme en cours d'execution, ou de tester du code en 
mode interactif sans disposition particuliere. 

Ce dynamisme fait partie egalement de la philosophic de programmation objet 
Python, basee sur le duck typing, decrit dans le chapitre 14. 

L'interpretation rend aussi I'execution plus lente, mais ce defaut est surmontable 
grace a de bonnes pratiques de programmation et des techniques d'optimisation 
decrites dans le chapitre 13. 

Les applications ou les performances sont un facteur critique ne seront pas ecrites a 
100 % en Python, mais pourront avantageusement etre nivelees : un noyau code en 
C, C++ ou tout autre langage compile, et une couche superieure en Python, pour 
toutes les parties non critiques. 

Le langage Cython, decrit dans le chapitre 13, permet en outre de conserver les bene- 
fices de la syntaxe de Python tout en manipulant des structures compilees en 
langage C. 



Python et les autres langages 

Si vous etes habitue a un autre langage, cette section, sans vouloir faire un comparatif 
exhaustif, presente les differences majeures entre Python et d'autres outils. 
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Python et Perl 

Le chapitre 2 fournit des elements de comparaison avec le langage Perl, relatifs a la 
programmation systeme. En attendant, void un message humoristique publie sur la 
mailing-list Python il y a quelques annees, qui decrit bien une des differences 
majeures entre Python et Perl : la lisibilite. 

Comparaison de Perl et Python par Yoda 

Sur laplanete Dagobah, 

avec Yoda accroche dans son dos, Luke grimpe sur une des vignes qui poussent dans le 
marais pour atteindre le laboratoire de statistiques de Dagobah. 

II y continue ses exercices, greppe, installe des nouveaux paquets,se connecte en root, ecrit des 
nouvelles versions de scripts en Python pour remplacer des scripts Perl vieux de deux ans. 

Yoda : Ecris du code ! Oui. La force d'un programmeur decoule de la maintenabilite de son 
code. Mais mefies-toi de Peril Syntaxe laconique, plus d'une maniere de faire quelque 
chose ! Le cote obscur de la maintenabilite Perl est. Si une seule fois par le chemin obscur tu 
t'engages, pour toujours ta destinee sera marquee. 

Luke : Est-ce que Perl est mieux que Python ? 

Yoda : Non... non... non. Plus rapide, plus facile, plus seduisant. 

Luke : Mais comment saurais-je pourquoi Python est mieux que Perl ? 

Yoda : Tu sauras. Quand le code ecrit ily a 6 mois de relire tu tenteras. 

Ruby, PHP, Java... 

En Janvier 2005, lors de la premiere edition de ce livre, ce chapitre presentait un 
comparatif entre Python et les autres langages. Ce comparatif avait du sens car la 
maturite des langages a l'epoque n'etait pas encore tres avancee dans certains 
domaines. Ruby par exemple ne supportait pas encore l'Unicode, et PHP commen- 
cait a supporter un modele objet depuis quelques mois. 

En 2009, les langages de programmation modernes ont tous evolue et apportent tous 
une reponse efficace dans un ou plusieurs domaines d'application, sans souffrir de limi- 
tations. Cependant, ils component toujours des faiblesses, meme si en general des outils 
complementaires les pallient, a l'image de ce qu'Eclipse apporte a Java par exemple : des 
automatismes repondent au manque d'expressivite de la syntaxe du langage. 

Aujourd'hui, Python n'est certainement pas superieur a d'autres langages. Sa philo- 
sophic, qui est distillee tout au long de ce livre, est une facon de programmer. Mais, 
contrairement a des langages specifiques comme PHP qui se focalise sur un domaine 
precis, Python est universel. II peut etre utilise dans un grand nombre de contextes. 
Les domaines d'application les plus repandus sont presentes dans le chapitre suivant. 
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For tiny projects (100 lines or fewer) that involve a lot of text pattern matching, I am still 
more likely to tinker up a Perl-regexp-based solution [...] For anything larger or more com- 
plex, I have come to prefer the subtle virtues of Python — and I think you will, too. 

« Pour les petits projets de moins de cent lignes qui necessitent beaucoup de 
recherche de texte, je prefere encore la solution Perl et ses outils d'expressions regu- 
lieres. Pour tout projet plus grand ou plus complexe, j'opte a present pour les vertus 
de Python, et je pense que vous y viendrez aussi. » 

Eric Raymond 

Le langage C pour l'embarque, Ada pour les systemes critiques, Perl pour les expres- 
sions regulieres, etc. Chaque langage a ses sujets de predilection, que ce soit pour des 
raisons historiques ou parce qu'il offre de reels avantages dans le domaine. 

Ce chapitre decrit les differents domaines dans lesquels Python est le plus utilise, au 
travers d'exemples concrets, a savoir : 

• l'administration systeme ; 

• le prototypage rapide d'applications ; 

• la recherche et le calcul scientifique ; 

• les applications de gestion ; 

• les applications web. 

Cette liste n'est certainement pas exhaustive mais represente les domaines les plus 
frequemment cites. 
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Administration systeme 



Les administrateurs systeme ont souvent besoin de concevoir des petits programmes 
pour automatiser certaines taches. lis utilisent generalement l'interpreteur de com- 
mandes, qui offre une syntaxe basique pour concevoir des sequences d'operations. 

Toutefois ce systeme est tres limite et n'offre que des fonctionnalites de tres haut 
niveau : certaines operations sur le systeme ne sont pas possibles sans appels a des 
programmes annexes. 

Utiliser des langages de plus bas niveau comme le C permet de lever ces limitations, 
mais la conception des scripts devient vite fastidieuse et delicate. 

Python, concu a l'origine pour ce cas de figure, s'intercale entre l'interpreteur de com- 
mandes et le C, en proposant un niveau intermediate, c'est-a-dire un shell surpuissant, 
et dans le meme temps un langage de programmation plus simple et plus direct. 

Bien que ce genre de besoin soit plus frequent sur les systemes Unices (les systemes 
de la famille Unix), il n'est plus rare de rencontrer des administrateurs Windows qui 
aient adopte Python pour la conception de leurs scripts systeme. 

Des API simples et efficaces 

Un langage de manipulation d'un systeme d'exploitation doit permettre de travailler 
avec ce dernier de maniere pertinente et concise. Manipuler un systeme consiste 
notamment a : 

• manipuler des fichiers et des dossiers ; 

• manipuler des programmes ; 

• envoyer et recevoir des e-mails ; 

• echanger des informations avec d'autres systemes. 

Manipuler des fichiers et des dossiers 

La manipulation du systeme de fichiers est triviale et puissante en Python. Prenons 
l'exemple d'un script dont l'objectif est de faire la copie d'un dossier en ne conservant 
que les fichiers dont la taille ne depasse pas 1 Mo. 

Recopie conditionnelle 

#!/usr/bin/python 

• -*- coding: utf8 -*- 
import os 

from shutil import copytree 
import sys 
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MEGA = 1024*1024 



def _ignore(di r, filenames): 
def _filter(di r, filename): 

full name = os. path. join (di r, filename) 
big_file = os. path. getsize (full name) > MEGA 
i f bi g f i 1 e : 

print('%s trop gros' % fullname) 
else: 

print('%s recopie' % fullname) 
return big file 

return set( [filename for filename in filenames 
if _filter(di r, filename)]) 

if name == ' main ': 

copytree(sys .argv[l] , sys.argv[2], ignore=_ignore) 

Ce petit script multi-plate-forme utilise pour recopier une arborescence l'API 
copytree du module shutil, qui gere tous les aspects inherents au systeme de 
fichiers comme les problematiques de droits d'acces ou encore les liens symboliques 
qui risqueraient de faire partir le programme dans une boucle infinie. 

II est bien sur perfectible, mais temoigne du confort fourni par les API systeme de 
Python : seul le code qui definit si un fichier d'une arborescence est recopie ou non 
est ecrit, le reste etant deja fourni. 

Cette recherche de puissance et de simplicite est une constante dans revolution du 
langage Python (l'argument ignore de copytree a ete introduit dans la version 2.6 
du langage). 

Manipuler des programmes 

Imaginons qu'un administrateur rencontre un probleme avec son serveur web 
Apache, qui s'arrete plusieurs fois par jour sans raison apparente. Ce probleme ne se 
retrouve malheureusement que sur le serveur de production. II faut done reussir a le 
resoudre tout en maintenant le service. L'administrateur souhaite concevoir un petit 
script qui precede a une serie de tests avant de relancer Apache. 

Sans entrer dans les details des tests operes, voici a quoi pourrait ressembler le script 
en question : 

Script de surveillance d'Apache 

# -*- coding: utf8 -*- 

import os 

from subprocess import call 
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from urllib2 import urlopen 
from urllib2 import HTTPError 
from urllib2 import URLError 
import socket 

from outils import run_audit 

URL_CHECK = ' http: //local host :80/server-status' 
CMD_START = 'apache2ctl start' 

def apache_running() : 

"""Verifie le statut d'Apache""" 
try: 

res = urlopen(URL_CHECK) 
except HTTPError: 

# reponse inattendue (URL_CHECK desactive ?) 

# mais Apache repond 
return True 

except (socket. timeout, URLError): 

# pas de reponse ou erreur 
return False 

return True 

def check_apache() : 

""" surveille l'etat du daemon Apache """ 
if not apache_runm'ng() : 

# Tests sur le systeme 
run_audit() 

# Apache doit etre relance 
call(CMD_START, shell=True) 
if apache_running() : 

print('Apache relance avec succes') 
else: 

print('Impossible de relancer Apache') 
else: 

print('Etat OK') 

check_apache() 

Ce script appelle une page web de statut d'Apache grace au module urllib2, puis 
relance Apache via 1API cal 1 du module subprocess. 

Ce script est facilement portable sur tout autre systeme compatible avec Python si le 
chemin vers la commande utilisee et FURL de controle de statut sont adaptes a la 
version dApache. 
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Envoyer et recevoir des courriers electroniques 

Apres le systeme de fichiers, la maitrise des e-mails est primordiale pour un adminis- 
trateur systeme. Souvent, l'e-mail est le seul lien entre 1'administrateur et l'ensemble 
des utilisateurs, ou entre 1'administrateur et ses serveurs. Envoyer ou recevoir des e- 
mails etant trivial au niveau du shell ou integre a l'outillage disponible sur la plate- 
forme (comme Nagios), l'interet de programmer l'envoi d'e-mails par des scripts 
Python est limite. 

La reception et le traitement automatique d'e-mails de structures complexes est en 
revanche une operation beaucoup plus delicate. Prenons un exemple concret : 1'admi- 
nistrateur souhaite automatiser la mise en place des cles SSH (voir encadre) des utilisa- 
teurs sur le serveur. II propose a ces derniers de lui envoyer un e-mail contenant l'iden- 
tifiant de l'utilisateur et la cle en piece attachee a une adresse e-mail prevue a cet effet. 

Le script a realiser doit automatiquement recuperer ces e-mails, placer la cle sur le 
serveur et envoyer un accuse de reception a l'utilisateur. Les e-mails traites sont 
ensuite archives dans un repertoire Traites de l'adresse e-mail dediee. 

Mise en place automatique des des SSH 

# -*- coding: utf8 -*- 

from imaplib import IMAP4 

from smtplib import SMTP 

from email import message_f rom_string 

from email .MIMEText import MIMEText 

def setup_key(contenu_nom, contenu_cle) : 

""" met en place la cle sur le systeme """ 

def get_connectors() : 

"""Mise en place des connecteurs. """ 
imap_server = IMAP4C local host ') 
imap_server.login('cles@localhost' , 'motdepasse') 
i map_server . create ( ' INBOX .Trai tes ' ) 
return imap_server, SMTPC local host') 

def processO : 

"""Cere les demandes.""" 

# initialisation des connecteurs 
imap_server, smtp_server = get_connectors() 

# mise en place de 1 'accuse de reception 
mail = MIMEText (u'Vot re cle SSH est activee') 
mail [' From'] = u'administrateur <root@localhost>' 
mail ['Subject'] = u'Cle SSH activee' 
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# acces a la racine de la boite 
i map_se rver. select ('INBOX') 

def _get_payload_content(mail , index): 

return mail . get_payload (index) .get_payload() .strip() 

# lecture des messages 

for mail_id in imap_server.search(None, 'ALL')[1]: 
if mail_id.strip() == ' ' : 

continue 
mail_content = imap_server.fetch(mail_id, ' (RFC822) ') [1] [0] [1] 
mail_received = message_f rom_string(mail_content) 

if not mail_received.is_multipart() : 

# mauvaise structure, 1 'e-mail 

# devrait etre compose de deux parties 
continue 

# expediteur 

from_ = mail_received[' From'] 

# lecture nom 

name = _get_payload_content(mail_received, 0) 

# recuperation cle 

key = _get„payload_content(mail„received, 1) 

# deplacement message sur serveur dans sous-dossier "Traites" 
imap_server. copy('INBOX.Traites' , mail_id) 
imap_server.store(mail_id, 'FLAGS', ' (\Deleted) ') 

# place la cle sur le systeme 
setup_key(name, key) 

# accuse de reception 
mail ['To'] = f rom_ 

sender. sendmail ('administrateur <root@localhost>' , from_, 
mail .as_string()) 



# fermeture des connecteurs 
server .expunge() 
server .close() 
server .logout() 
sender .quit() 



if name == 

processQ 



_mai n_ 
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Moins de cent lignes sont necessaires pour mettre en place ce processus relativement 
complexe, grace a la simplicite d'utilisation des modules en charge des echanges avec 
le serveur de courriels. 



Culture Le SSH en deux mots 

Le SSH {Secure Shell) est un shell securise par lequel les utilisateurs peuvent se connecter au serveur. 
Tous les echanges sont chiffres. 

Pour qu'un serveur reconnaisse automatiquement un utilisateur au moment d'une connexion SSH, il est 
possible d'utiliser des des. Les des SSH sont un couple de fichiers texte que I'utilisateur genere sur son 
poste par le biais d'un petit utilitaire. Un des deux fichiers (la de dite privee) reste sur le poste de I'utili- 
sateur et I'autre (la de publique) est place sur le serveur. Ces deux des, de la meme maniere qu'avec le 
logiciel GnuPG, sont confrontees au moment de la connexion pour authentifier I'utilisateur. 
Ce moyen de connexion est souvent le plus sur et parfois la seule voie proposee par I'administrateur pour 
se connecter a un systeme. 



Echanger des informations avec d'autres systemes 

Toujours dans l'idee d'automatiser les dialogues entre le serveur et d'autres acteurs du 
systeme, maitriser les differents protocoles directs d'echanges de donnees doit etre 
aussi simple que l'envoi d'e-mails. 

Prenons l'exemple des mises a jour systeme dans un pare de serveurs. La regie ins- 
tauree est qu'une machine de l'lntranet met a disposition par le biais d'un serveur 
FTP tous les patchs que les serveurs doivent telecharger et executer. Le pare de 
machines est relativement homogene, constitue de serveurs GNU/Linux sous distri- 
bution Debian et de serveurs Windows 2000. Sur le serveur FTP, un repertoire pour 
chacune des plates-formes contient les derniers patchs a recuperer et executer. 

Chaque serveur est responsable de sa mise a jour. Le script a composer, qui doit pou- 
voir s' executer sur n'importe quelle plate-forme du pare doit done : 

• recuperer les bons patchs ; 

• les telecharger ; 

• les executer ; 

• les archiver. 

La derniere etape ne consiste qua conserver les fichiers telecharges. 

Mise a jour centralisee automatique 

• -*- coding: utf8 -*- 
import os 

from StringlO import StringlO 
from ftplib import FTP 
import logging 



Decouverte de Python 

Premiere partie 



patches_done = os.listdi r(os.curdi r) 
patches_todo = [] 
_result = StringlOO 

# fonctions de recuperation des flux ftp 
def callback(line) : 

_result. write (line) 

def callbacktext(line) : 

_result.write('%s\n' % line) 

def readresults(text=False) : 

content = _result.getvalue() 
_result.buf = ' ' 
return content 

# code principal 

ftp = FTP(' local host') 

ftp . 1 ogi n ( ' root ' , ' motdepasse ' ) 

try: 

ftp.cwd(os.name) 

ftp.di r(callbacktext) 

patches = readresults() .split('\n') 

# tous les fichiers telecharges sont binaires 
ftp.voidcmd('TYPE I') 

for patch in patches: 
line = patch .split () 
if len(line) == 0: 

continue 
filename = line[-l] 
if filename in patches_done: 

continues 
ftp. retrbi nary ('RETR %s' % filename, callback) 

with open (filename, 'w') as file_: 

file_.write(readresults()) 
os.chmod(filename, 467) # 467 dec => 111 010 Oil bin => rwx-w--wx 
patch_file = os .path. join (os.curdi r, filename) 
patches_todo . append (patch_f i 1 e) 
f i nal 1 y : 

ftp.close() 

for patch in patches_todo: 

# le patch est auto-executable 

logging.infoC application du patch %s . . . ' % patch) 
log = os. popen(patch) 

logging.info('\n ' .join (log)) 
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Les autres protocoles sont rarement plus complexes a implemented sauf lorsqu'il est 
necessaire de proceder en entree et en sortie a des traitements de donnees plus 
pousses. 



A SAVOIR Lancement automatique des scripts 

Les exemples precedents et ceux qui suivront dans ce chapitre ont tous ete concus pour etre executes par 
le systeme de maniere automatique et reguliere, que ce soit par le biais des taches cron sur les systemes 
de type Unix ou par une nouvelle entree dans le gestionnaire de taches sur les plates-formes Windows. 



Le match Perl-Python 

La partie concernant 1' administration systeme serait incomplete sans parler de Perl. 
Le langage Perl est souvent le langage prefere des administrateurs et a remplace dans 
beaucoup de cas le shell. Perl est tres puissant, possede une enorme bibliotheque de 
modules facilement accessible (CPAN) et une communaute tres active. 

Ce langage souffre cependant de defauts qui peuvent peser lourd lors de la concep- 
tion d'applications consequentes, comme une syntaxe pas tres lisible, de l'aveu meme 
de Larry Wall, son createur, et de structures de donnees difficiles a construire et 
manipuler. Perl reste cependant tres puissant pour les manipulations de texte. 

« Perl is worse than Python because people wanted it worse » 

— Larry Wall 

Syntaxe 

Prenons l'exemple d'un script en charge de preparer le repertoire web personnel d'un 
utilisateur lorsqu'il est ajoute a un systeme GNU/Linux. Le programme doit remplir 
les taches suivantes : 

• creation d'une page web personnelle ; 

• ajout dans le serveur Apache d'un Virtual Directory ; 

• envoi d'un e-mail de notification au nouvel utilisateur. 

La page web creee permet a l'utilisateur d'avoir des liens personnalises vers les appli- 
catifs du groupware de l'entreprise comme le Webmail. 

Sans entrer dans les details du programme, nous allons simplement presenter ici la 
partie qui consiste a creer la page web personnelle. Cette section du programme peut 
elle-meme etre decoupee en trois etapes : 

1 Chargement d'un modele de page web. 

2 Personnalisation du modele en fonction de l'utilisateur. 
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Les occurrences de %(NOM) et %(PRENOM) sont remplacees par des valeurs 
reelles. 
3 Creation du fichier dans le repertoire web de l'utilisateur. 

Version en Python 

# -*- coding: utf8 -*- 
import os 

def create_page(fi rstname, lastname, template, path): 
""" creation de la page web """ 

replace = {'NOM': fi rstname, 'PRENOM': fi rstname} 
with open (model) as model_file: 

page = model_file. read() % replace 

with open(os .path. joi n(path , 'index.html'), 'w') as target: 
target. write (page) 

La version Perl est tres similaire en termes de facilite de mise en ceuvre et de lon- 
gueur de code, mais beaucoup moins lisible. 

La version Perl 

use strict; 
use warnings; 

sub creation_page 
{ 

my ($fi rstname, Slastname, Smodel , Spath) = (@_) ; 

open I, "<" , Smodel ; 

my $page = do { local $/; <I> }; 

close(I) ; 

Spage =~ s/%(NOM)s/$lastname/g; 
$page =~ s/%(PRENOM)/$fi rstname/g; 

open 0, ">", "$path/i ndex.html " ; 

print Spage; 

close(O); 



Structures de donnees 

La creation et la manipulation de structures de donnees en Perl est relativement 
lourde. Dans l'exemple ci-apres, la creation d'une simple classe, sans aucun contenu, 
necessite quatre fois plus de code en Perl qu'en Python : 
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Definition d'une classe en Perl et en Python 



# Version Perl 
package MyClass; 
sub new { 

my Sclass = shift; 
my $self = {}; 
bless Sself, Sclass 

$self->initializeO ; # do initialization here 
return Sself; 
} 

# Version Python 
class MyClass: 

pass 

Cette syntaxe verbeuse de Perl, qui se confirme dans toutes les definitions de struc- 
ture, peut etre pesante dans la conception d'applications de grande taille, et aug- 
ments proportionnellement les risques de bogues. 

Manipulation de texte 

En termes de manipulation de texte, les outils disponibles pour Perl sont a l'heure 
actuelle beaucoup plus puissants que pour Python. 

A titre d'exemple, les expressions regulieres sous Python sont un portage de ce qui 
existait a l'epoque pour Perl 5, et n'ont plus evolue depuis. 

La possibilite d'etendre le moteur d'expressions regulieres sous Perl est inexistante 
sous Python. 

Extension du moteur regexp sous Perl 

# exemple tire de l'aide en ligne de Perl 

# permet d'ajouter '\Y| ' au moteur 

# qui est un raccourci pour (?=\S) (?<!\S) | (?!\S) (?<=\S) 
package customre; 

use overload; 

sub import { 

shift; 

die "No argument to customre: : import allowed" if @_; 

overload: :constant 'qr' => \&convert; 
} 

sub invalid { die "/$_[0]/: invalid escape '\\$_[1]'"} 
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my %rules = ( '\\' => '\V , 

'Y|' => qr/(?=\S)(?<!\S)|(?!\S)(?<=\S)/ ); 
sub convert { 

my $re = shift; 
$re =~ s{ 

\\ ( \\ I Y . ) 
} 

{ $rules{$l} or inva~lid($re, $1) }sgex; 
return $re; 
} 

Conclusion 

Perl reste superieur pour la conception de petits scripts de moins de 100 lignes, 
lorsqu'il s'agit de manipuler des chaines de caracteres. La puissance de ses outils et 
son integration poussee des expressions regulieres en font un choix de premier ordre 
dans ce cas. Python devient meilleur pour de plus grosses applications. 



Prototypage rapide d 'applications 

Pour les gros projets qui durent plusieurs mois, voire plusieurs annees, les premieres 
etapes consistent souvent a effectuer des cycles de specification entre les clients et 
l'equipe de developpement, en se basant sur des maquettes. 

Objectif d'une maquette 

Concevoir une maquette permet a l'architecte d'un logiciel de prendre du recul et de 
reduire la marge entre ce qu'il a imagine et ce qu'il faut reellement implemented 
Arme de ce prototype, il va deceler tres vite certaines problematiques de logique 
d'implementation, mais egalement fournir au client un veritable jouet pour tester les 
fonctionnalites. Si ce dernier est lui-meme technicien, il pourra faire evoluer la 
maquette pour exprimer ses besoins de maniere plus directe. 

Ces cycles d'echange permettent d'affiner les besoins initiaux, pour obtenir sur le 
papier un projet plus realiste et plus mur lorsque les developpements demarrent. lis 
peuvent meme continuer pendant les phases de developpement, lors de l'introduc- 
tion de nouvelles fonctionnalites. 

Une maquette est done un veritable logiciel pate a modeler, facile a creer et a modi- 
fier. Les maquettes peuvent etre des maquettes d'interfaces ou plus simplement des 
maquettes de code. 
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Maquette d'interfaces 

Pour les logiciels dotes d'une interface graphique, la maquette est constituee d'une 
serie d'ecrans lies entre eux par des menus et des boutons. C'est avant tout l'ergo- 
nomie de l'interface et la logique des enchainements qui priment, car ils sont bien 
souvent tres proches des processus metier souhaites par le client. 



Culture Definition de I'ergonomie 

L'ergonomie consiste a ameliorer l'interface homme-machine, en rendant I'outil le plus simple et le plus 
logique possible aux yeux d'un utilisateur. Un programme ergonomique est en general utilisable sans 
avoir a se referer a I'aide en ligne et diminue au maximum le nombre d'etapes necessaires a I'utilisateur 
pour obtenir le resultat recherche. 



La plupart des projets s'arretent aux maquettes d'ecrans sur le papier, qui sont suffi- 
santes pour exprimer l'interface d'un logiciel. Pour les projets web par exemple, des 
captures d'ecrans suffisent amplement a donner une idee de l'ergonomie. Mais une 
maquette d'interface sur le support cible (c'est-a-dire l'ecran) avec une interaction 
minimale, permet de meilleurs retours. 

II existe plusieurs methodes pour creer des interfaces avec Python. La plus interes- 
sante pour les exercices de maquettage consiste a utiliser les Environnements de 
Developpement Integre (EDI) qui proposent des editeurs visuels d'interfaces. Cer- 
tains n'ont pas forcement de liens avec Python et se contentent de generer des 
fichiers pour chaque fenetre dessinee. Ceux-ci peuvent ensuite etre charges et inter- 
preted par un programme Python par le biais de bibliotheques specialisees. Le pro- 
gramme associe alors une portion de code a chaque evenement provoque par I'utilisa- 
teur, selon le principe de la programmation evenementielle. 

On peut citer comme EDI pour Python : 

• Glade, qui permet de construire des interfaces Gnome/GTK+ sauvegardees dans 
des fichiers XML, pouvant etre interpretes par une bibliotheque Python specifique. 

• BoaConstructor, inspire des principes des composants VCL de I'outil Delphi de 
Borland, et manipulant wxPython, bibliotheque au-dessus de wxWindows. 

• QtDesigner, sur le meme principe que BoaConstructor mais pour les bibliotheques Qt. 
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Figure 2-1 QTDesigner a I'oeuvre 



Culture Programmation evenementielle 

La programmation evenementielle, utilisee pour les applications a interface graphique, associe a chaque 

evenement de I'utilisateur une portion de code. 

Un evenement peut etre par exemple Taction de cliquer sur un bouton d'une fenetre. Le programme 

lorsqu'il est execute, entre dans une boucle infinie qui attend qu'un evenement se produise. Lorsque 

c'est le cas, I'appel est transmis a la portion de code definie pour cet evenement, si elle existe, puis la 

boucle repasse en attente d'un autre evenement. 

Ce type de programmation est plus detaille dans le chapitre 10, dans la partie consacree a Tkinter. 



Maquette de bibliotheque ou Fake 

Un autre type de maquette beaucoup moins utilise mais tres pratique est la maquette 
de bibliotheque. Complement des maquettes d'interfaces, ce genre de prototype 
permet de simuler un service qui n'a pas encore ete developpe. 



Exemple de prototype de bibliotheque 

Prenons 1' exemple d'un module de pilotage d'un appareil electronique que Ton sou- 
haite interfacer avec une application graphique. 
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La mise au point de ce module peut etre complexe car elk necessite 1' elaboration de 
protocoles d'echanges avec l'appareil par le biais du port IEEE. De plus, les per- 
sonnes en charge de developper le reste de l'applicatif n'ont pas a leur disposition ce 
genre d'appareil et doivent pourtant continuer le developpement de 1' application 
comme s'ils en disposaient. 

Les methodes qui seront accessibles aux programmes qui piloteront l'appareil sont 
quant a elles tres simples : 

• start() : initialise l'appareil ; 

• stopO : met l'appareil hors-tension ; 

• run(commande) : lance une commande. 

Chacune de ces methodes renvoie vrai lorsque la commande a fonctionne. 

Une maquette pour cette bibliotheque pourra se contenter de fournir ces methodes et 
de toujours renvoyer un resultat positif sans que l'appareil reel ait ete appele : 

Prototype 

• -*- coding: utf8 -*- 
import time 

class Appareil (object) : 

def init (self) : 

self. started = False 

def start(self) : 

self. started = True 

time.sleep(5) 

return 'OK - Listening' 

def stop(self) : 
time.sleep(5) 
self. started = False 
return 'OK - Closed' 

def runCommand(self , command, *args) : 
time. sleep(2) 
return 'OK %s' % command 

Ce Fake pourra suffire dans un premier temps a construire le reste de l'application en 
se basant sur l'interface fournie. 



PROGRAMMATION Simuler des serveurs a I'aide des Fakes 

Les applications qui interagissent avec des serveurs tiers utilisent souvent cet artifice pour simuler leur 
presence dans des contextes particuliers comme lors de I'execution de tests unitaires. Une application de 
gestion d'e-mails peut implementer dans ce genre de contexte un « faux » serveur IMAP. 
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Recherche et calcul scientifique 



Certains domaines de recherche sont devenus totalement dependants de l'informatique. 
II existe quantites de logiciels dedies pour chacun de ces domaines, mais des lors que le 
chercheur souhaite sortir des sentiers battus, il doit programmer lui-meme ses outils. 

Dans cet exercice, il cherche un outil de programmation simple a maitriser, qui per- 
mette de manipuler facilement quantite de donnees et utiliser des bibliotheques de 
calcul tierces. 

Les tableurs comme Excel, qui proposent des fonctionnalites de scripting, sont les 
outils les plus repandus dans les laboratoires de recherche, car ils permettent de 
manipuler tres simplement les donnees et de modeliser rapidement des calculs. Mais 
des lors que les traitements se complexifient ou qu'il est necessaire de mettre en place 
des protocoles particuliers, les tableurs atteignent leurs limites. 

Pas de paradigme impose 

Python dans ce cas devient un choix de premier ordre car il est multi-paradigme : un 
chercheur n'aura done pas besoin de maitriser la programmation oriente objet pour 
ecrire ses petits scripts, comme il devrait le faire en Java. II se contentera d'ecrire son 
programme avec de simples fonctions, sans avoir a maitriser de concept purement 
informatique. 

Facilite de prise en main 

Contrairement aux langages de plus bas niveau comme le C, qui necessitent un cer- 
tain bagage technique informatique, Python est beaucoup plus simple a maitriser 
pour un chercheur qui ne connait pas la programmation. La gestion de la memoire, 
1'utilisation de pointeurs, le typage des variables, et tous les details de i'implementa- 
tion d'un programme sont autant de contraintes qui sont loin des preoccupations 
premieres d'un chercheur, et doivent le rester. 

Parallelement, la facilite avec laquelle une bibliotheque de traitement peut etre inte- 
gree au langage comme extension fait de Python un outil de script de choix dans ce 
domaine. 

Creation ou utilisation d'outils specialises 

Prenons l'exemple de la biologie moleculaire. Si le chercheur souhaite confronter des 
sequences d'ADN a des sequences connues et repertoriees dans un depot centralise 
comme le depot GenBank, il doit mettre en place un outil d'acces au serveur distant 
pour etre en mesure de l'interroger puis d'interpreter les fichiers. 
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Nous avons vu dans les exemples precedents que le langage Python disposait d'une 
bibliotheque d'acces FTP simple d'usage. Construire une bibliotheque d'acces aux 
depots GenBank n'est pas plus complique. Une fois mise au point, cette bibliotheque 
offre au chercheur la possibilite d'utiliser et de reutiliser ce genre de systeme dans ses 
programmes. 

En l'occurrence, la bibliotheque d'acces au depot GenBank et de lecture des fichiers 
existe deja : elle fait partie d'un ensemble d'outils Python dedies a la bio-informa- 
tique nomme Biopython, cree par des chercheurs en biologie moleculaire. Toujours 
dans l'esprit des logiciels libres, ces outils sont mis a disposition de tous sur Internet. 



Recherche Le projet GenBank 

La base de donnees GenBank (http://www.ncbi.nlm.nih.gov/) est un projet international de regrou- 
pement de sequences de nucleotides et leur traduction en proteines. Ces donnees sont fournies par des 
centres de sequencages du monde entier et sont librement consumables en ligne. 



Applications de gestion 

Les applications de gestion peuvent etre definies comme des logiciels qui traitent un 
probleme metier particulier, comme : 

• la gestion de stocks ; 

• la gestion de la relation client ; 

• la gestion financiere, etc. 

Ces logiciels se caracterisent en general par : 

• une interface utilisateur pour saisir, visualiser et manipuler des donnees ; 

• un besoin de stockage de donnees qui peut parfois etre assez consequent en taille ; 

• une standardisation des flux d'entrees et de sorties pour integrer le programme au 
pare applicatif existant. 

Conception (('interface utilisateur 

Outre la conception et l'enchainement d'ecrans decrits dans la partie concernant le 
prototypage, une application de gestion a un besoin fondamental d'ergonomie. 
Lorsque de simples maquettes peuvent se contenter dans la plupart des cas des com- 
posants visuels (widgets) de base, il s'avere souvent necessaire de creer ses propres 
composants pour de veritables applications. En pratique, la creation d'une interface 
en adequation avec les besoins metier et la nature des donnees peut peser tres lourd 
dans la balance lorsque l'utilisateur teste l'outil. 
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Prenons l'exemple de 1' application GRAMPS (http://gramps-project.org/). Ce logiciel 
de gestion de genealogie, ecrit en Python, offre une interface de visualisation des 
liens de parente entre des personnes. Cette fonctionnalite prend tout son sens grace 
au composant specifiquement developpe pour afficher des arbres genealogiques. 



Figure 2-2 

Visualisation des liens 
de parente avec GRAMPS 
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Tous les kits a disposition du developpeur Python fournissent un framework de crea- 
tion de nouveaux widgets. 



Stockage de donnees 

Le stockage de donnees, appele aussi persistance, peut prendre differentes formes en 
fonction des besoins et des contraintes du programme. II peut parfois s'agir d'un 
simple besoin de sauvegarde de parametres de fonctionnement. Dans ce cas de 
figure, les fichiers INI ou autres fichiers XML font l'affaire. Mais lorsque les besoins 
de stockage s'etendent, d'autres outils plus en adequation avec la quantite et la granu- 
larite des donnees manipulees doivent prendre le relais. 

Serialisation des objets 

Python fournit des fonctionnalites de serialisation des objets interessantes. La seriali- 
sation consiste a sauvegarder sur le systeme de fichiers l'etat d'un objet stocke en 
memoire. Cette mecanique peut etre par exemple utilisee pour memoriser l'etat d'un 
objet lorsque l'application se termine, pour pouvoir le restaurer au prochain demar- 
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rage. Le principe de serialisation est aussi tres utile dans des programmes distribues. 
Ce mecanisme fonctionne pour tous les objets Python a quelques exceptions, comme 
nous le verrons dans le chapitre 9. 

Exemple de serialisation d'un objet 

# -*- coding: utf8 -*- 
import cPickle 

class MyClass: 
value_l = '1' 
val ue_2 = 5 

# creation d'un objet 
example = MyClassO 

example. val ue_l= u'je suis modifie' 

# sauvegarde 

with open ('MyCl ass. sav' , 'wb') as file_: 
cPickle.dump(example, file_, 1) 

# rechargement 

with open('MaClasse.sav' , 'rb') as file_: 
new_example = cPickle.load(file_) 

# verification des valeurs 
pr i nt (new_exampl e . val eu r_l) 
print(new_example. valeur_2) 

Ce systeme, appele pickling, peut etre utilise pour les besoins de sauvegarde de tout 
type de programme, mais il impose un certain nombre de contraintes au deve- 
loppeur. Une des problematiques les plus importantes est que ce fonctionnement 
introduit une dependance forte entre le code et les donnees : si ce systeme est utilise 
pour des sauvegardes durables, toute modification des attributs d'une classe rend les 
sauvegardes precedentes caduques. Les evolutions du code sont done plus complexes 
a gerer. Une bonne pratique consiste done a ne sauvegarder que des instances de 
classes ou de types de Python ou de sa bibliotheque standard. 

Quoi qu'il en soit, dans le cas d'une application de gestion qui travaille avec des don- 
nees qui peuvent provenir d'autres sources et dont le format est impose, on optera 
pour un stockage plus classique. 
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Les bases de donnees relationnelles 

Outre tous les connecteurs existants pour la quasi-totalite des bases de donnees du 
marche dans des bibliotheques tierces, Python integre dans la bibliotheque standard 
(depuis la version 2.5) un module d'acces au systeme de base de donnees SQLite 
(http://www.sqlite.org). Cette base de donnees ne necessite aucune configuration et 
aucun serveur pour fonctionner, et stocke ses donnees dans un simple fichier ou en 
memoire. Elle est largement repandue depuis quelques annees et utilisee pour des 
besoins de stockage leger. 

Creation d'une table et ajout de lignes avec sqlite 

# connection 

conn = sq"lite3. connect (' data. dt>') 
c = conn.cursorO 

# creation de la table table 
c.executeC create table client (fi rstname text, lastname text)') 

# ajout d'une ligne 
c.executeC'insert into client values ('Tarek', 'Ziade')") 

# Sauvegarde 
conn .commitO 

# Fermeture du curseur 
c.closeQ 



Installation SQLite 

Python fournit dans sa bibliotheque standard un acces a SQLite, mais ce dernier doit etre installe sur le 
systeme. 



II existe egalement des systemes de Mapping Objet-Relationnel (Object-Relational 
Mapping en anglais, ou ORM) tres efficaces en Python. Les ORM permettent 
d'associer a une table de la base une classe, et a une ligne de cette table une instance 
de la classe, et de s'occuper automatiquement des echanges vers le SGBD. Le code 
de manipulation des donnees peut des lors s'affranchir du langage SQL. 

Les deux systemes les plus notables sont : 

• SQLAlchemy : http://www.sqlalchemy.org 

• Storm : https://storm.canonical.com 
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Applications web 



Les applications web sont des applications qui mettent en jeu la quasi-totalite des 
technologies informatiques actuelles. 

La conception d'un Intranet necessite couramment la mise en oeuvre : 

• d'annuaires LDAP ; 

• de gestion de flux de donnees varies ; 

• de systemes distribues ; 

• d'un systeme de publication web avance, etc. 

Une application web est bien souvent la brique centrale d'un systeme d'information, 
et doit offrir aux developpeurs des outils souples et modulaires pour implementer 
toutes les fonctionnalites necessaires, s'integrer a un pare applicatif, et s'interfacer 
avec des applications tierces qui participent aux services fournis par 1' applicatif. 

Les frameworks web Python ont connu une evolution majeure depuis trois ans, pour 
deux raisons : 

• La vague provoquee par le projet Ruby On Rails (http://rubyonrails.org), qui a 
donne envie a la communaute Python de moderniser la programmation Web. 

• Lemergence de la norme WSGI (http://wsgi.org) qui a permis de partager entre 
certains frameworks des briques pour la conception de fonctionnalites. 

Les frameworks majeurs sont : 

• Zope : http://zope.org 

• Twisted : http://twistedmatrix.com/trac 

• Pylons : http://pylonshq.com 

• Django : http://www.djangoproject.com 

• Turbogears : http://turbogears.org 

Le framework Zope, par exemple, est l'un des plus gros projets Open Source Python. 
De nombreuses evolutions et innovations du langage sont issues de ce framework et 
de sa communaute tres active. 

De nouveaux frameworks emergent egalement, comme Repoze (http://repoze.org). 

Lensemble de ces frameworks sont tres actifs et propulsent Python sur le devant de 
la scene en matiere de developpement web. 
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En un mot... 



Meme si Python est beaucoup plus a l'aise dans certains domaines vus dans ce chapitre, 
comme la programmation systeme ou le prototypage, ses facultes d'extension et son 
ouverture lui permettent de s' adapter relativement facilement a de nouveaux contextes. 

II n'est plus rare par exemple de rencontrer dans le secteur industriel des applications 
critiques dont les couches superieures sont codees en Python. 

Le prochain chapitre presente Installation de Python et son parametrage, ainsi 
qu'un tour d'horizon de quelques editeurs de code. 



3 



Environnement de 
developpement 



Ce chapitre presente la mise en place d'un environnement de developpement pour 
Python, de l'installation de l'interpreteur jusqu'au choix de l'editeur de code. 



Installation sous Linux 

Python est souvent preinstalle sur la plupart des distributions GNU/Linux. Vous 
pouvez controler sa presence en tapant la commande python dans un terminal. 

Lancement du mode interactif de Python 

$ python 

Python 2.6.1 (r261:67515, Dec 6 2008, 16:42:21) 

[CCC 4.0.1 (Apple Computer, Inc. build 5370)] on darwin 

Type "help", "copyright", "credits" or "license" for more information. 

>» 

Si la commande fonctionne, vous serez automatiquement place dans un mode inte- 
ractif qui permet de lancer directement des commandes dans l'interpreteur Python. 
La version du langage etant precisee, vous pouvez savoir si une mise a jour est pos- 
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sible. II est en general recommande d'etre a jour avec la derniere version stable, sauf 
contraintes de production particulieres. 



A RETENIR Quitter I'interpreteur Python 

Pour sortir du mode interactif, utilisez les combinaisons de touches Ctrl+D sous GNU/Linux et Mac OS X 
et Ctrl+Z sous MS-Windows. 



S'il vous est necessaire d'installer Python ou de mettre a jour une version existante, 
vous pouvez le faire par le biais du systeme de package de la distribution ou le recom- 
piler manuellement. Les manipulations d'installation se font en tant que super-utili- 
sateur, ou root. 

Pour etre root survotre systeme, il est necessaire d'executer la commande su, ou de 
passer par l'utilitaire sudo, qui etend temporairement et de maniere controlee les 
droits d'un utilisateur autorise. 

Installation par distribution 

Linteret d'utiliser l'installation par paquets est de pouvoir mettre a jour le systeme a 
chaque nouvelle version sans avoir a se soucier des problemes de dependances, de 
manipulations particulieres ou de post-conditions necessaires du systeme. II suffit la 
plupart du temps d'invoquer une seule ligne de commande en lui passant en para- 
metre le fichier paquet concerne. 

Paquets Debian 

Les paquets Debian sont des fichiers d'extension .deb qui peuvent etre installes par le 
biais de l'utilitaire dpkg. Ce systeme est utilise principalement sur Debian et sur 
Ubuntu. II existe en outre un utilitaire encore plus direct, capable de telecharger sur 
Internet puis d'installer la derniere version d'un paquet : apt 

Installation par apt 

I $ apt-get "install python2.6 

apt-get telecharge automatiquement le paquet et l'installe sur le systeme. Confort 
ultime, il se charge tout seul de recuperer et d'installer les eventuels paquets annexes, 
en controlant toutes les dependances. 

http://packages.debian.Org/stable/python/python2.6 
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Paquets RedHat 

De maniere similaire a Debian ou Ubuntu, les distributions basees sur RedHat, que 
ce soient les versions professionnelles payantes comme Red Hat Entreprise ou les ver- 
sions communautaires comme Fedora Core ou CentOS, proposent le systeme de 
paquets rpm, un des tout premiers systemes de paquetage qui ait vu le jour. 

Installation ou mise a jour par rpm 

$ rpm -i python. rpm 
$ rpm -U python. rpm 

► http://www.python.Org/download/releases/2.6/rpms 

Distributions Mandrake et Fedora Core 

Les distributions Mandrake et Fedora Core, toutes deux basees sur le systeme de paquets 
rpm, proposent des systemes similaires a apt, respectivement nommes urpmi et yum. 

urpmi et yum 

$ urpmi python 

$ yum install python 

► http://www.python.0rg/download/releases/2.6/rpms 



Systemes de Paquet Delais de disponibilite 

II peut se passer plusieurs mois avant qu'une nouvelle version de Python soit disponible en paquets sta- 
bles pour une distribution Linux, a cause des longueurs des cycles de release. 

A I'heure ou ce livre est imprime, c'est le cas : Python 2.6 n'est pas encore tres diffuse, et une installation 
specifique peut etre necessaire. 



Compilation des sources 

Si votre distribution ne propose pas de systeme de paquets ou si tout simplement, 
vous souhaitez faire une installation personnalisee de Python, il est necessaire de pro- 
ceder a une compilation des sources du langage pour creer les fichiers binaires equi- 
valents a ceux qui sont fournis dans les paquets. 

Compiler un logiciel sous GNU/Linux ou Mac OS X consiste a lancer une serie de 
commandes a un ou plusieurs programmes du systeme. La plupart du temps, le pro- 
gramme invoque est le compilateur gcc qui va generer les binaires. Cette operation se 
fait en general dans un repertoire dedie du systeme ou tous les fichiers sources com- 
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piles sont conserves. La premiere etape consiste a decompresser le fichier tarbatt, 
fichier archive d'extension . tar . gz, que vous trouverez sur le site de Python. 



Ressources Le site off iciel du langage Python 

Le site officiel du projet Python offre des informations de premier ordre, et propose les demieres versions 
du langage en telechargement : 

► http://www.python.org 

► http://www.python.Org/download/releases/2.6.1 



Recuperation et decompression du tarball de Python 2.6.1 

$ wget http://www.python.Org/ftp/python/2.6.l/Python-2.6.l.tgz 
$ tar -xzvf Python-2 .6. l.tgz 
$ cd Python-2. 6.1 

Cette manipulation va creer un repertoire Python-2 .6.1 avec l'ensemble des sources 
de la distribution ainsi que les fichiers de configuration necessaires a la compilation. 

Etapes (('installation 

Une distribution de sources est en general livree avec des fichiers Makefile et 
configure. Makefile contient toutes les commandes qui seront executees pour l'ins- 
tallation. II sera appele par le biais de l'utilitaire make. Le fichier configure, quant a 
lui, est un script en charge de : 

• Controler que le systeme remplit toutes les conditions necessaires a 1' execution du 
script d'installation et d'informer l'utilisateur des eventuels manques. 

• Creer un fichier de parametres utilise par Makefile, qui contiendra entre autres 
les options definies par l'utilisateur. 

Les etapes d'installation sont done : 

• controler le systeme et definir les options de compilation ; 

• compiler les sources ; 

• installer les binaires et autres modules dans le systeme. 

Options de compilation 

Le script configure definit un ensemble impressionnant de parametres que vous 
pouvez visualiser par le biais de 1' option --help. 
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Ecran d'aide du fichier configure de Python 



$ ./configure --help 

'configure' configures python 2.6 to adapt to many kinds of systems. 

Usage: ./configure [OPTION]... [VAR=VALUE] . . . 

To assign environment variables (e.g., CC, CFLAGS...), specify them as 
VAR=VALUE. See below for descriptions of some of the useful variables. 

Defaults for the options are specified in brackets. 

Configuration : 

-h, --help display this help and exit 

-n, --no-create do not create output files 

--srcdir=DIR find the sources in DIR [configure dir or '..'] 

Installation directories: 

--prefix=PREFIX install architecture-independent files in 

PREFIX 

[/usr/local] 
--exec-prefix=EPREFIX install architecture-dependent files in 
EPREFIX 

[PREFIX] 

[...] 

L'ecran d'aide, comme pour les prochains extraits, a ete largement tronque. L'option 
la plus utilisee est l'option prefix qui definit le repertoire cible de rinstallation. Le 
script y recopiera le resultat de la compilation dans un sous-repertoire bin et les 
bibliotheques Python dans un sous-repertoire lib. Le prefixe par defaut etant /usr/ 
local, le binaire executable Python sera installe dans /usr/local /bin et les biblio- 
theques dans /usr/local /lib. Mais il est frequent de modifier ce prefixe pour ins- 
taller Python directement dans le repertoire /usr. 

Execution de configure 

$ ./configure --prefix=/usr 

checking MACHDEP... Iinux2 

checking EXTRAPLATDIR. . . 

checking for --without-gcc. . . no 

[...] 

configure: creating ./config. status 

conf ig. status : creating Makefile. pre 

conf ig. status : creating Modules/Setup. config 

conf ig. status : creating pyconfig.h 
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config. status : pyconfig.h is unchanged 
creating Setup 
creating Setup. local 
creating Makefile 

Une fois le script configure execute avec succes, il ne reste plus qua compiler et ins- 
taller Python, par le biais des commandes make et make i nstal 1 . 



Compilation et installation de Python 

Ces deux etapes entierement automatiques peuvent prendre un certain temps en 
fonction de la puissance de votre machine. 

Compilation et installation 

$ make 

gcc -pthread -c -fno-strict-aliasing -DNDEBUG -g -03 -Wall 

-Wstrict-prototypes -I. -I. /Include -DPy_BUILD_C0RE -o Modules/config.o 

Modul es/conf i g . c 

[...] 

*) CC='gcc -pthread' LDSHARED='gcc -pthread -shared' 0PT='-DNDEBUC -g 

-03 -Wall -Wstrict-prototypes' ./python -E ./setup. py build;; \ 

esac 

running build 

running build_ext 

running build_scripts 

$ make install 

/usr/bin/install -c python /usr/bin/python2 .6 

if test -f libpython2 .6. so; then \ 

if test ".so" = .dll; then \ 

/usr/bin/install -c -m 555 libpython2 .6. so /usr/local/ 
bin; \ 

else \ 

/usr/bin/install -c -m 555 libpython2.6.so /usr/local/ 
lib/libpython2 .6. a; \ 

if test libpython2 .6. so != libpython2 .6. a; then \ 
(cd /usr/lib; In -sf libpython2 .6. a 
libpython2.6. so) ; \ 
fi \ 
fi; \ 
else true; \ 
fi 

/usr/bin/install -c -m 644 ./Lib/aifc. py /usr/lib/python2 . 3 
/usr/bin/install -c -m 644 ./Lib/anydbm.py /usr/lib/python2 .3 
/usr/bin/install -c -m 644 ./Lib/asynchat .py /usr/lib/python2 . 3 
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Python est a present installe sur le systeme et peut etre lance par la biais de la com- 
mande pythonX.X ou X.X est le numero de version. S'il n'y a pas d'autres installations 
de Python sur le systeme, la commande python permet aussi de lancer l'interpreteur, 
grace au lien /usr/bi n/python qui pointe sur la commande. 

Gerer plusieurs versions de Python 

II arrive que plusieurs versions de Python cohabitent sur la meme machine. Vous 
pouvez les repertorier par le biais de la commande wherei s. 

Plusieurs versions de Python installees 

[tziade@Tarek ~]$ wherei s python 

python: /usr/bi n/python /usr/bi n/python2 .4 /usr/lib/python2 . 5 /usr/lib/ 
python2.5 /usr/local /bin/python /usr/"local/bin/python2 .6 /usr/local/ 
lib/python2 .6 /usr/include/python2 .6 /usr/include/ 

Ce cas de figure est en general a proscrire car il rend l'installation et le suivi des exten- 
sions plus delicats. Toutefois, certains programmes ne sont pas forcement compatibles 
avec la derniere release et l'installation d'une version anterieure peut parfois s'averer 
obligatoire. La version principale de Python, c'est-a-dire celle qui sera utilisee dans la 
majeure partie des cas, doit etre associee au chemin par defaut de l'interpreteur afin 
d'etre automatiquement utilisee lorsque la commande python est invoquee. 

Prenons le cas d'une machine ou les versions 2.6 et 2.5 ont ete installees. Bien qu'il 
n'y ait pas de probleme majeur a executer les programmes concus avec la version 2.5 
sur une version 2.6, il est tout de meme recommande d'utiliser la version d'origine, 
c'est-a-dire la 2.5. Dans ce cas, les programmes doivent etre appeles avec la com- 
mande python2.5. 



Installation sous MS-Windows 

Les plates-formes MS-Windows beneficient d'un installeur graphique automatique, 
presente sous la forme d'un Wizard (un assistant). Si vous n'avez pas les droits admi- 
nistrateurs sur la machine, il est possible de selectionner dans les options avancees 
une installation en tant que non-administrateur. L'installation de Python par ce biais 
ne presente aucune difficulte. 
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Figure 3-1 

Installation sous MS-Windows 



i";, Python 2.6.1 Setup 



f» 



python 

for 

windows 



Select whether to install Python 2.6.1 
for all users of this computer. 



In. till K.i ill i.i :er. 

O Install just for me (not available on Windows Vista) 



Back 



Une fois l'installation achevee, une nouvelle entree Python 2.6 apparait dans le menu 
Demarrer>Programmes, contenant entre autres l'interface IDLE. L'execution de ce 
menu doit faire apparaitre un prompt Python. 



Figure 3-2 

Idle sous MS-Windows 
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La derniere etape consiste a ajouter dans la variable PATH, le chemin vers l'interpre- 
teur, de maniere a pouvoir l'appeler dans l'invite de commande quel que soit l'endroit 
ou Ton se trouve. 
► http://www.python.Org/ftp/python/2.6.1/python-2.6.1.msi 
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Installation sous Mac OS X 

Sous Mac OS X version superieure ou egale a 10.5, il existe une version de Python 
preinstallee, mais incomplete. II est done preconise d'installer la version complete, 
disponible sur l'lnternet a l'adresse suivante : 
► http://www.python.Org/ftp/python/2.6.1/python-2.6.1-macosx2008-12-06.dmg 

L'image disque python-2.6.1-macosx2008-12-06.dmg contient un installeur 
MacPython .mpkg, qui peut etre lance pour installer Python. 



AVERTISSEMENT Controler la version de Python executee 

La version preinstallee de Python reste installee sur le systeme, et il est necessaire de controler, lorsqu'un 
script est execute, que e'est bien la nouvelle version complete de Python qui est utilisee. 



Premiers tests de Python en mode interactif 

Pour tester Installation, nous allons concevoir un tout premier programme qui 
affiche « Hello World ! ». Ce programme peut etre execute directement par le biais 
du mode interactif, ouvert par la commande python sur toutes les plates-formes, ou 
plus directement sous MS-Windows par l'environnement IDLE qui fournit un shell 
connecte avec le mode interactif. 

Le programme « Hello World » 

$ python 

Python 2.6.1 (r261:67515, Dec 6 2008, 16:42:21) 

[CCC 4.0.1 (Apple Computer, Inc. build 5370)] on darwin 

Type "help", "copyright", "credits" or "license" for more information. 

>» printC Hello World') 

Hello World 

Le mode interactif de Python fournit une invite de commande ou prompt, symbolise 
par le prefrxe >», qui interprets les commandes saisies et rend immediatement la 
main, en affichant s'il y a lieu, un resultat ou une erreur. 



issais du prompt 


>» 5 + 6 


11 


>» a = 3 
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>» 9 + 8 
17 

>» print(a) 
3 

>» je peux ecrire n'importe quoi !!! 
File "<stdin>", line 1 

je peux ecrire n'importe quoi !!! 

A 

SyntaxError: invalid syntax 

>» print('du moment que c'est syntaxiquement correct') 

du moment que c'est syntaxiquement correct 

Cette interactivite permet de tester de petites sequences de code. 



Script de demarrage du mode interactif 



Pour les systemes Unix, il est possible de mettre en place un script Python qui s' exe- 
cute a chaque lancement de l'interpreteur, en associant un nom de fichier a la variable 
d'environnement PYTHONSTARTUP. 

Dans l'exemple ci-dessous, le script .pythonstartup met en place i'autocompletion 
et un historique automatique. L'autocompletion permet d'utiliser la touche Tabula- 
tion pour completer une frappe en cours, que ce soit pour des mots-cles du langage 
Python ou pour des noms definis dans le contexte. L'historique automatique permet, 
quant a lui, de sauvegarder les lignes saisies dans l'interpreteur, et de rappeler cette 
sauvegarde lorsque l'interpreteur est relance. On navigue dans cette sauvegarde avec 
les touches Haut et Bas permettent de naviguer dans cette sauvegarde. 

Script de demarrage Python .pythonstartup 

import os 
import sys 
import atexit 
import readline 
import rl completer 

try: 

import readline 

has_readline = True 
except ImportError: 

has_readline = False 

if not has_readline: 
sys .exit(O) 
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print("Chargement des options") 

# tabulation 

readli ne. parse_and_bind("tab: complete") 

# historique 

home = os .path.expanduser('~') 

history_file = os. path. join (home, ' .pythonhi story') 

try: 

readl i ne . read_hi story_f i 1 e(hi story_fi 1 e) 
except IOError: 

pass 

atexi t . regi ster (readl i ne . wri te_hi story_f i 1 e , hi story_fi 1 e) 

# nettoyage de sys. modules 

del (os, sys, history, atexit, readline, rlcompleter, 
has_readline, home) 

Ce script est sauvegarde dans le dossier personnel, puis associe a la variable d'envi- 
ronnement PYTHON STARTUP. Si le shell courant est Bash, la ligne suivante peut etre 
ajoutee dans le fichier .bash re du repertoire personnel. 



Personnalisation de I'environnement 

I export PYTHONSTARTUP=~/.pythonstartup 



A SAVOIR Script de demarrage Python 

Certaines distributions fournissent parfois par defaut un script de demarrage standard comme celui pre- 
sente dans ce paragraphe. 

Des projets libres comme IPython proposent aussi des configurations plus poussees du mode interactif : 
► http://ipython.scipy.org/ 



Le choix d'un editeur 

Le choix des outils de developpement depend fortement du type de programmation 
realisee. Par exemple, un simple editeur de texte est amplement suffisant pour la con- 
ception de scripts systeme mais ne suffit plus pour la conception d'applications a 
interface graphique. 

Lorsque le developpeur a besoin de concevoir des interfaces graphiques, il peut opter 
pour des outils de conception independants de l'editeur de code ou, lorsqu'il existe, 
utiliser un EDI qui combine les deux fonctionnalites. 
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Les EDI corpus pour Python ne proposent parfois que de simples liens vers des con- 
cepteurs d'interfaces independants mais proposent d'autres fonctionnalites interes- 
santes, comme la gestion de projet ou la liaison avec un systeme de gestion de ver- 
sion, comme CVS ou Subversion. On peut done regrouper les outils disponibles en 
trois categories : 

• les editeurs de code ; 

• les editeurs d'interface ; 

• les EDI. 



A SAVOIR Editeurs d'interfaces graphiques 

Cet ouvrage ne portant pas sur la conception d'interfaces graphiques, seuls les editeurs de code sont pre- 
sent.es ici. 



Un ensemble non exhaustif, mais relativementvarie, d'editeurs a ete teste en fonction 
d'un certain nombre de criteres. Si un editeur ne figure pas dans la (courte et ephe- 
mere) liste presentee ici, les criteres sont suffisamment explicites pour que l'outil soit 
evalue facilement. 

Les criteres de comparaison retenus sont : 

• la coloration syntaxique (CS) ; 

• la standardisation automatique (SA) ; 

• les raccourcis clavier et les macros (RC) ; 

• l'edition multiple (EM) ; 

• le repliement de code et la recherche (RR) ; 

• l'autocompletion (AC) ; 

• l'interpreteur et le debogueur embarques (IE) ; 

• la licence, le prix (LIC) ; 

• les plates-formes proposees (PF). 



La coloration syntaxique 

La coloration syntaxique du code, qui met en exergue les mots-cles du langage et dif- 
ferencie les blocs de commentaires des autres plates-formes lignes, est une fonction- 
nalite non negligeable pour le confort de lecture. Elle ne figure pas dans le tableau 
comparatif car tous les editeurs presentes en sont dotes. Un editeur sans coloration 
syntaxique est done a eviter. 
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La standardisation automatique 

Le remplacement automatique des caracteres tabulation par des espaces, et la sup- 
pression des espaces en fin de ligne (trailing spaces) standardised le code sauvegarde. 
Certains editeurs proposent en outre de gerer le nombre maximum de caracteres par 
ligne. Pour information, la norme est de 80 caracteres par ligne en Python. 

Les raccourcis clavier et les macros 

La possibility d'indenter plusieurs lignes en une seule manipulation, les raccourcis 
clavier permettant de saisir automatiquement des portions de code ou tout element 
generique comme les en-tetes (macros), sont autant d'elements qui accelerent l'ecri- 
ture du code. Certains editeurs proposent de programmer soi-meme des macros en 
associant des scripts Python a des raccourcis clavier, ce qui augmente considerable- 
ment la productivite. 

Ledition multiple 

La possibilite d'ouvrir plusieurs fichiers a la fois et la facilite de navigation entre les 
differentes fenetres d'edition deviennent vite des elements de choix incontournables. 
Tous les editeurs presentes ont cette fonctionnalite. 

Le repliement de code et la recherche 

Le repliement de blocs de code (folding) consiste a masquer et demasquer le corps 
d'une classe, methode ou fonction. Cette fonctionnalite peut s'averer tres pratique 
pour les fichiers dont la taille est importante, surtout dans un langage qui ne separe 
pas distinctement la partie declaration de la partie implementation. La facilite de 
recherche dans le code est indispensable, surtout pour les editeurs qui ne possedent 
pas le repliement. 

L'autocompletion 

Lautocompletion permet de completer la frappe en affichant une liste de possibilites 
extraites de l'ensemble des fonctions et classes disponibles du contexte en cours. 
Cette fonctionnalite est tres repandue dans les EDI fournis avec les langages pro- 
prietaires comme Delphi, C# ou encore Visual Basic et l'environnement Java Eclipse. 
Certains editeurs ont opte pour une autre approche, moins contraignante pendant la 
saisie du code mais moins ergonomique : un referentiel du langage est fourni et faci- 
lement accessible, et un double-clic sur un element l'insere dans le code. 



Decouverte de Python 

Premiere partie 



L'interpreteur et le debogueur embarques 

Pouvoir invoquer l'interpreteur Python directement depuis l'editeur pour executer le 
script ou pour tester une portion du code, minimise les allers-retours entre l'editeur 
et le shell systeme. Cette fonctionnalite est assez pratique sous MS-Windows, ou le 
shell est moins integre au bureau, mais plus anecdotique sous des plates-formes 
comme GNU/Linux, ou il est facile d'organiser plusieurs fenetres de shell qui 
accompagnent le travail de l'editeur. Un debogueur embarque est une fonctionnalite 
beaucoup plus interessante, surtout lorsqu'il permet d'inserer directement des points 
d'arret dans le code et de fonctionner en mode pas-a-pas. Le debogage interactif sans 
cette fonctionnalite necessite plus de manipulations. 

La licence 

Les editeurs presentes sont pour la plupart distribues gratuitement sous licences 
GPL ou derivees. Qyelques logiciels commerciaux de tres bonne facture sont toute- 
fois presentes, comme WinglDE. Le prix de vente de ces editeurs est en general d'un 
montant ridicule. 

Les plates-formes reconnues 

Pour les developpeurs Sans Plate-forme Fixe (SPF), le choix d'un editeur fonction- 
nant sous MS-Windows, Mac et Unix permet de conserver ses habitudes d'une 
plate-forme a l'autre. Dans le tableau suivant, la lettre L represente Unix et ses 
derives, la lettre M, Mac OS, et enfin la lettre W, MS-Windows. 

Le tableau ci-apres presente un certain nombre d'editeurs ou chaque fonctionnalite 
est notee de la maniere suivante : 

• : inexistante ; 

• 1 : incomplete ; 

• 2 : suffisante ; 

• 3 : parfaite. 



Tableau 3-1 Comparatif des editeurs Python 
















Norn SA RC RR AC IE PF 
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Bluefish 

Interessant uniquement si I'edition de code Python est mineure par rapport a I'edi- 
tion de fichiers XML et HTML (programmation web haut niveau en WYSIWYG) 


1 


1 


1 








L 


GPL 
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Tableau 3-1 Comparatif des editeurs Python (suite) 



Norn SA RC RR AC IE PF LIC 


DrPython 

Editeur correct, extensible par des scripts Python et plug-ins, ce qui le rend tres inte- 
ressant. Une bibliotheque de plug-ins est disponible sur le Web directement depuis 
I'editeur. Dommage que I'autocompletion soit basique et mal con^ue, et qu'il n'y ait 
pas de debogueur integre. 





3 


3 


1 


1 


L,W 


GPL 


Emacs, Xemacs, Vim, Vi et derives 

Editeurs historiques complets et puissants et qui se parametrent aux petits oignons, 
meme si cette tache reste laborieuse. lis rendent tres productif mais la courbe 
d'apprentissage est lente. lis peuvent parfois etre couples a d'autres editeurs (binds 
emacs/vi). 


3 


3 


3 


2 


1 


L,W 


GPL 


Kate 

Integre a KDE et relativement souple, Kate est un editeur multi-usage. Attention aux 
problemes d'encodage parfois sur certaines distributions comme Ubuntu. Debogage 
et autocompletion Python inexistants. 


2 


2 


3 








L 


GPL 


IDLE 

Installe d'office sous MS-Windows avec Python. Le parent pauvre en termes de fonc- 
tionnalit.es, a abandonner au profit d'un autre editeur. 


2 


1 


1 


1 


1 


L,W 


GPL 


PyDev 

Necessite I'installation et I'experience d'Eclipse. Tres interessant si le travail de 
Python se fait en parallele de Java, via Jython par exemple. Petites configurations 
s'abstenir. 


2 


2 


2 


3 


1 


L,W 


GPL 


Eric3 

L'autocompletion est illogique, voire enervante. Reste toutefois un excellent editeur. 


1 


2 


3 


2 


3 


L,W 


GPL 


BoaConstructor 

Encore tres bogue a I'heure actuelle. Possede un outil de construction d'expressions 
regulieres et quelques options interessantes. Inspire de Delphi, BoaConstructor pro- 
pose un editeur d'interfaces wxPython. 


1 





1 


1 





L,W 


GPL 


BlackAdder 

La version d'essai se ferme toutes les 1 minutes. Autocompletion tres mauvaise. Le 
reste des fonctionnalites est de bonne facture. Le prix reste trap cher. 


1 





1 


1 





L,W 


PR 


Komodo 

Bon editeur, supporte aussi Perl, PHP et TCL. Autocompletion mauvaise. 


2 


3 


2 


3 


3 


L,W 


PR 


WinglDE 

Un des meilleurs editeurs pour Python, concu par des developpeurs Python pour des 
developpeurs Python. Le prix a payer est ridiculement bas par rapport a sa qualite. 
Permet de deboguer Zope. Reste quelques incoherences. 


2 


2 


3 


3 


3 


L,W 


PR 


SPE 

Editeur correct lorsqu'il n'y a pas de bogues qui rendent impossible I'edition de cer- 
tains fichiers (bogues d'encoding au moment de la sauvegarde, impossibility 
d'ouvrir certains fichiers), voire qui suppriment le contenu du fichier :(. Produit jeune 
a surveiller. 


2 


1 


3 


2 


1 


L,W 


GPL 
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Figure 3-3 L'editeur Eric3 en action 



En un mot... 



Les editeurs presentes dans ce chapitre ne sont qu'un apercu de la multitude des 
outils existants, et ce comparatif reste tres ephemere. L'essentiel reste d'etre a l'aise 
avec 1'environnement de developpement pour aborder la suite du livre. 

Le prochain chapitre presente la syntaxe du langage et les exemples pouvant tous etre 
rejoues dans le prompt. II est preferable d'avoir precede a l'installation de Python a ce 
point du livre. 



Deuxieme partie 






Elements 
du langage 

Un developpeur entretient une relation cognitive tees forte avec la syntaxe du 
langage qu'il utilise, comme peut le faire un peintre avec ses pinceaux et ses 
melanges de couleurs. 

Le vocabulaire emprunte par les developpeurs pour qualifier une portion de code est tees 
lie a la notion d'esthetisme et au plaisir ressenti lors de sa conception ou de sa relecture. 
Une fonction ecrite de maniere claire et concise est agreable, un module qui n'est pas 
bien organise est sale, un programme qui evolue facilement est beau, une classe qui 
implemente une fonctionnalite deja existante dans les primitives est bavarde, etc. 

Ce jugement est base sur un referentiel commun, qualifie de norme, et cette partie 
regroupe tous les elements necessaires pour ecrire du code Python standard : 

• la syntaxe du langage dans le chapitre 4 ; 

• la structuration du code dans le chapitre 5 ; 

• les primitives au chapitre 6 ; 

• les conventions de codage pour le chapitre 7. 

L'objectif est de fournir les outils de base du developpeur Python, sans pour autant 
remplacer un element essentiel pour ecrire du code avec gout : 1' experience. 



4 



Syntaxe du langage 



La syntaxe du langage Python est simple, concise et terriblement efficace. Cette par- 
ticularite a ete des le depart une volonte de Guido van Rossum, alias GvR, pour en 
faire un langage le plus productif possible. Et le fosse en termes d'efficacite entre 
Python et d'autres langages modernes se voit ligne apres ligne pour les developpeurs : 
le code saisi est en general immediatement fonctionnel et s'ecrit sans hesitation. 

Cette facilite est d'autant plus prononcee que la syntaxe des structures condition- 
nelles rapproche beaucoup Python du pseudo-code, ce qui necessite moins de 
reflexion sur la maniere dont une portion de code doit etre ecrite, contrairement a 
d'autres langages ou les temps d'arret dans 1'ecriture sont legion. 

Ce chapitre fournit la syntaxe du langage et est decoupe comme suit : 
l'instruction print ; 
les commentaires ; 
le modele de donnees ; 
les litteraux ; 
les types standards ; 
les operateurs ; 
l'indentation ; 
les structures conditionnelles. 
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[.'instruction print 



Ecrivons notre premier programme qui affiche a l'ecran quelques phrases : 
Utilisation de print 

>» print "II y a un monsieur avec une moustache qui frappe a la porte" 
II y a un monsieur avec une moustache qui frappe a la porte 
>» print "Dis lui de passer son chemin j'en ai deja une" 
Dis lui de passer son chemin j'en ai deja une 

La commande pri nt evalue une expression et affiche le resultat. Ce qui est vrai pour 
des phrases est aussi vrai pour des valeurs numeriques, des calculs ou tout autre ele- 
ment interpretable, car l'instruction convertit automatiquement le resultat de 
l'expression en une chaine de caracteres affichable, lorsque c'est possible. 

Utilisation de print #2 

>» print 3 

3 

>» print 3 * 3 

9 

>» print 3 + 4+5 

12 

>» print je ne suis pas interpretable 
File "<stdin>", line 1 

print je ne suis pas interpretable 

A 

SyntaxError: invalid syntax 



print devient fonction 

Une modification majeure sur le fonctionnement de print a ete introduite dans la 
version 3 de Python. Cette commande est passee du statut d'instruction a celui de 
fonction, ce qui rend les programmes ecrits pour Python 2 incompatibles avec 
Python 3 lorsqu'ils l'utilisent. 

Appel de print avec Python 3 

$ python 

Python 3.0+ (release30-maint:67944, Dec 27 2008, 14:34:16) 

[GCC 4.0.1 (Apple Inc. build 5465)] on darwin 

Type "help", "copyright", "credits" or "license" for more information. 

>» print 'Bonjour' 
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File "<stdin>", line 1 
print 'Bonjour' 

A 

SyntaxError: invalid syntax 

Le programme de conversion 2 to 3, presente au chapitre 8, permet de transformer le 
code d'un programme Python 2 en syntaxe compatible avec Python 3. II ne permet 
cependant pas de gerer la conversion de 1'utilisation de pri nt de maniere optimale, et 
se contente d'ajouter des parentheses. 

Transformations de print par 2to3 

>» print "du texte" # Python 2 

>» print("du texte") # Apres transformation avec 2to3 

>» print ("du", "texte") # Python 2 

>» print(("du", "texte" )) # Apres transformation avec 2to3 

Dans le deuxieme cas, le programme de conversion est incapable de differencier si 
print est utilise comme instruction ou comme fonction, et doublera les parentheses. 

II est possible de fournir a 2to3 une option pour traiter print comme une fonction, 
et une bonne pratique consiste a ecrire des programmes qui utilisent cette nouvelle 
syntaxe, en incluant un appel a future . pri nt_f unction. 

Utilisation de print comme une fonction, avec Python 2 

$ python2.6 

Python 2.6.1 (r261:67515, Dec 6 2008, 16:42:21) 

[CCC 4.0.1 (Apple Computer, Inc. build 5370)] on darwin 

Type "help", "copyright", "credits" or "license" for more information. 

>» from future import pri nt_f unction 

>» print 'ok' 

File "<stdin>", line 1 
print 'ok' 

A 

SyntaxError: invalid syntax 

>» print('Je fais comme Python 3!') 

le fais comme Python 3! 



Le passage a Python 3 est ainsi facilite. 



Bonne pratique print comme fonction 

Les exemples du livre utilisent print comme fonction, puisque c'est devenu une bonne pratique sous 
Python 2. 
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Les commentaires 

En Python, les commentaires sont prefixes par le caractere diese (#), et peuvent etre 
places en fin de ligne ou prendre une ligne complete. 

Exemples de commentaires 

# commentai re judicieux 
print("he"l"lo") # commentai re tres a propos 

# oubliez le commentai re precedent 

# celui-ci est bien mieux 

Linterpreteur syntaxique ignore ces commentaires et considere que le caractere diese 
marque la fin d'une ligne logique, sauf lorsqu'elle est liee a la ligne suivante par le 
caractere antislash (\). 



Modele de donnees 

Le modele de donnees de Python est base sur les objets. Toute donnee manipulee est 
un objet avec un identifiant, un type et une valeur. 

L'identifiant est une valeur entiere et definie une bonne fois pour toutes a la creation de 
l'objet. Elle est calculee a partir de l'adresse memoire de l'objet et garantit son unicite. 

Le type de l'objet est immuable et definit toutes les fonctionnalites qui pourront etre 
utilisees avec l'objet, et ce quel que soit ce type. 

La valeur attribute a l'objet peut etre modifiable en fonction du type de l'objet. Par 
exemple, les objets de type entier ou chaine de caractere ne peuvent pas etre modifies 
apres leur creation. On les appelle objets immuables. 

II existe une serie de primitives qui permettent de lire chacun des attributs decrits : 

• id() : renvoie l'identifiant d'un objet. 

• type() : renvoie le type d'un objet. 

• dir() : liste l'ensemble des fonctionnalites d'un objet. 

Manipulation d'objets de type entier 

>» id(l) 
134536624 
>» type(l) 
<type 'int'> 
>» dir(l) 
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[' abs ', ' add ', ' and ', ' class ', ' cmp ', ' coerce_ 

delattr ', ' div ', ' divmod ', ' doc ', ' float ', 

floordiv ', ' getattribute ', ' getnewargs ', ' hash ', 

hex ', ' init ', ' int ', ' invert ', ' long ', 

Ishift ', ' mod ', ' mul ', ' neg ', ' new ', 

nonzero ' , ' oct ' , ' or ' , ' pos ' , ' pow ' , ' radd 

rand ' , ' rdiv ' , ' rdivmod ' , ' reduce ' , ' reduce_ex 

repr ', ' rfloordiv ', ' rlshift ', ' rmod ', ' rmul ', 

ror ', ' rpow ', ' rrshift ', ' rshift ', ' rsub ', 

rtruediv ' , ' rxor ' , ' setattr ' , ' str ' , ' sub ' , 

truediv ', ' xor '] 



Les objets ne sont jamais explicitement detruits, ce travail etant realise automatique- 
ment par le gestionnaire de memoire de Python. Cette fonctionnalite, nominee 
ramasse-miettes ou garbage collector, est basee sur un compteur de reference associe a 
chaque type d'objet. Ce mecanisme peut etre observe et en partie modifie grace au 
module gc qui fournit une interface d'acces. 

Pour l'utiliser, liez l'objet a une variable par le biais d'une affectation. 

Affectation d'une variable 

>» a = 1 

>» a 

1 

>» id (a) 

134536624 

>» type (a) 

<type 'int'> 

Aucune syntaxe particuliere nest necessaire pour cette affectation et la variable a 
devient une reference a l'objet. 
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Systeme Optimisation memoire 

Pour tous les objets immuables dont le type et la valeur sont identiques, le gestionnaire de memoire peut 
decider de ne conserver qu'une seule instance et de toujours s'y referer, optimisant ainsi I'utilisation de la 
memoire : 

>» a = 1 

>» b = 1 

>»id(a) 

134536624 

>»id(l) 

134536624 

>»id(b) 

134536624 

>» a is b 

True 
Cette optimisation peut considerablement reduire la taille memoire occupee. Les objets modifiables, 
quant a eux, sont bien sur toujours uniques : 

>» a = [] 

>» b = [] 

>»id(a) 

1211995860 

>»id(b) 

1212018900 

>»id([]) 

1211995892 



Les litteraux 



Les litteraux sont des constantes qui definissent une valeur. II en existe trois type 
Python : 

• valeurs alphanumeriques ; 

• valeurs numeriques ; 

• nombres complexes. 



:s en 



Litteraux alphanumeriques 

Les chaines de caracteres sont des valeurs alphanumeriques entourees par des guille- 
mets simples ou doubles, ou dans une serie de trois guillemets simples ou doubles. Ces 
dernieres sont appelees chaines triple-quoted et permettent de composer des chaines 
sur plusieurs lignes et contenant elles-memes des guillemets simples ou doubles. 
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Chaines de caracteres simples et triple-quoted 



>» print("Nous avons trouve une sorciere ! Allons-nous la bruler ?") 

Nous avons trouve une sorciere ! Allons-nous la bruler ? 

>» print('Au secours ! je suns opprime') 

Au secours ! je suis opprime 

>» print("""on est cense etre ici pour s'amuser 

... ne nous chamaillons pas pour savoi r qui a tue qui""") 

on est cense etre ici pour s'amuser 

ne nous chamaillons pas pour savoi r qui a tue qui 

II est par ailleurs possible de prefixer les chaines par le caractere : 

• r ou R pour specifier que le contenu est du texte brut, ou les caracteres antislash (\) 
n'ont plus le meme usage. Ce prefixe est surtout utilise pour travailler avec du 
contenu brut de texte, comme : 

- lors de recherches de sequences par le biais d'expressions regulieres ; 

- avec des chaines riches en antislash, comme les chemins sous Windows 
(r'c:\ici\et\la'). 

• u ou U pour specifier que le texte est une chaine de caracteres Unicode sous 
Python 2. 

• b ou B pour specifier que le texte est de type bytes depuis Python 2.6. 

Normes ASCII et Unicode 

Sous Python 2, les chaines sont par defaut des chaines de caracteres codees sur 8 bits 
dont le type est str. Pour exprimer des chaines de caracteres en anglais, ce type 
suffit, en se basant sur la norme ASCII {American Standard Code for Information 
Interchange) de 1961. 

Pour les langues comme le francais, les 128 caracteres de la table ASCII ne suffisent plus, 
et une table etendue sur 256 caracteres a permis d'introduire de nouveaux caracteres 
comme « e » ou « a ». Le probleme est que cette extension varie d'une langue a l'autre. 
Cette variation entraine un veritable casse-tete pour les programmes multilingues car il 
est necessaire de gerer des encodages differents en fonction de la langue utilisee. 

Pour simplifier ce probleme, la norme Unicode a ete initiee en 1991. Elle repond a 
un souhait d'unification de tous les systemes d'encodage de caracteres pour proposer 
un referentiel unique, independant de toute plate-forme ou logiciel, et global a toutes 
les langues. 



En pratique Unicode version 3.2 

A I'heure ou ces lignes sont ecrites, la version 3.2 propose 95 221 caracteres, symboles et directives. 
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Le support d'Unicode a ete introduit dans Python 2.4, et peut etre utilise avec des 
chaines prefixees du caractere u comme vu precedemment, qui deviennent des objets 
de type Unicode. 

Chaines Unicode 

>» Unicode = u"Je suis en Unicode." 

>» unicode.encodeC utf8') 

'Je suis en Unicode. ' 

>» 'je vais etre en Unicode' .decode() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 8: 
ordinal not in range(128) 

>» 'je vais etre en Unicode' .decode('utf8') 
u'je vais \xeatre en Unicode' 

Des methodes d'encodage et de decodage permettent de passer du type str au type 
Unicode, en utilisant une table de correspondance, appelee codec et portant un nom 
unique (utf8 est utilise dans l'exemple). 

Mais cette situation n'est qu'une transition vers un environnement ou l'Unicode 
devient le type par defaut pour la gestion des chaines de caracteres. 



Evolution de l'Unicode de Python 2 a Python 3 

Python 3 adopte le standard Unicode de base, et le prefixe u disparait. Python 2.6, 
quant a lui, ajoute un nouveau type bytes, qui est un synonyme du type str. Le pre- 
frxe b peut etre utilise pour ce type. 

Le prefixe b 

>» b'je suis un bytes' 
'je suis un bytes' 

Linteret de ce synonyme est de permettre aux developpeurs d'utiliser dans leurs pro- 
grammes Python 2.6 un marqueur simple pour differencier les chaines qui ne sont 
pas utilisees dans le programme pour stocker du contenu textuel d'une langue 
donnee. Ce contenu textuel est de preference stocke dans des chaines uni code. 

Donnee vs contenu textuel 

>» b'datal234' 

'datal234' 

>» u'je suis une phrase moi , pas de la donnee !' 

u'je suis une phrase moi, pas de la donn\xe9e !' 
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Un programme qui respecte cette convention pourra passer sans probleme a la 
version 3 de Python, ou le type uni code disparait : les chaines uni code deviennent des 
chaines str sans prefixe grace a une conversion automatique (avec le programme 2to3). 
Les chaines bytes, quant a elles, deviennent directement des chaines bytes Python 3. 

Pour resumer : 

• Python 2.3 et inferieur- Les chaines sont toutes stockees dans des objets de type 
str. 

• Python 2.4 et Python 2.5 - Les chaines sont stockees dans des objets de type str 
ou Unicode, avec des methodes de conversion. Les conventions suivantes sont 
adoptees : 

- Les chaines de caracteres dediees a du texte utilisent le type Unicode avec le 
prefixe u. 

- Les chaines de donnees utilisent le type str sans prefixe. 

• Python 2.6 - Le prefrxe b fait son apparition et permet d'indiquer que la chaine 
est de type bytes. C'est un synonyme de str. La chaine sans prefixe reste aussi 
une chaine str, et les chaines Unicode sont toujours presentes. Les conventions 
suivantes sont adoptees : 

- Les chaines dediees a du texte utilisent le type uni code avec le prefixe u. 

- Les chaines de donnees utilisent de preference le type bytes avec le prefixe b, afin 
de les differencier des chaines de texte avec le test i si nstance (texte , bytes) . 

• Python 3.0 et superieur - Le type uni code disparait et devient le type str, et le 
prefixe u est egalement retire. Enfin, l'ancien type str devient le type bytes. Les 
conventions suivantes sont adoptees : 

- Les chaines de caracteres utilisent le type str sans prefixe. 

- Les chaines ASCII classiques utilisent le type bytes avec le prefixe b. 

Caracteres speciaux 

II est possible, comme avec le langage C, d'inserer des caracteres speciaux dans les 
litteraux. Le caractere antislash ou backslash (\), permet d'integrer ces caracteres afin 
qu'ils soient interpretes comme des commandes. Void un tableau contenant la liste 
complete des caracteres speciaux disponibles en Python : 

Tableau 4-1 Caracteres speciaux pour le backslash 

Description Exemple 

et " Guillemet simple ou double, permet >» print(' 1\' apostrophe') 

d'eviter de casser I'enrobage d'une 1 ' apostrophe 
chaine 
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Tableau 4-1 Caracteres speciaux pour le backslash (suite) 



Caractere Description Exemple 


n 


Saut de ligne 


>»print('ok\ncorral ') 

ok 

corral 


r 


Retour chariot, souvent place avant 

un saut de ligne sur les plates-formes 

Windows. 

Le code de fin de de ligne (EOL) varie 

d'une plate-forme a I'autre (Mac : 

V, Windows : '\r\n', Unix: '\n') mais 

tend a s'uniformiser vers '\n'. 


>»print('bataine\r\na\r\nok\r\ncorral ') 

bataille 

a 

ok 

corral 


\ 


Antislash ou backslash 


>»print('le fichier est dans 

c:\\f-ichiers\\') 

le fichier est dans c:\fichiers\ 


V 


Tabulation verticale 


»>print('l\v2') 

1 
2 


t 


Tabulation horizontale 


>»pr i nt ( ' i ci \tou\tai 11 eu r s ' ) 
ici ou ailleurs 


a 


Bip 


>»print('un bip : \a') 
un bip : 


b 


Backspace 


>»print('parfois je mange mes \b\b\b\b\b 

mots') 

parfois je mange mots 


nnn 


Valeur octale sur trois chiffres 


>»print('\124out a fait') 
Tout a fait 


xHH 


Valeur hexadecimale sur deux chif- 
fres 


>»print('7 est \x3E a 6') 
7 est > a 6 


unnnn 


Caractere Unicode code sur 1 6 bits 


>»print u'\u00bfHabla espa\u00flol?') 
^Habla espanol? 


N{nom} 


Caractere Unicode defini par le nom 


>»print u'\N{POUND SIGN}' 
£ 



Litteraux numeriques 

II existe trois types de litteraux numeriques pour representer des valeurs : 

• les entiers simples ou longs ; 

• les valeurs a virgule flottante ; 

• les nombres complexes. 
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Litteraux pour les entiers 

En Python, un entier peut etre represente sous forme decimale, binaire, octale ou 
hexadecimale. 

Representation decimale 

Classiquement, la forme decimale est representee par une sequence de chiffres numeri- 
ques. La plage des valeurs possibles s'etend de a 2 147 483 647, ce qui correspond a 
une valeur non signee sur 32 bits et permet de representer un entier naturel. 

Pour obtenir des valeurs negatives et etendre la representation aux entiers relatifs, le lit- 
teral est prefrxe de l'operateur - pour former une expression correspondant a la valeur. 

Pour toutes les valeurs qui depassent cette plage, des entiers longs doivent etre utilises. 
Un entier long est represente de la meme maniere qu'un entier, mais suffixe par la lettre 
L ou 1 . II est conseille d'utiliser la version majuscule afin d'eviter une eventuelle confu- 
sion avec le chiffre 1. II n'y a pas de limite de representation pour les entiers longs mise 
a part la memoire virtuelle disponible de l'ordinateur. En d'autres termes, et contraire- 
ment a beaucoup d'autres langages, il n'y a pas besoin de mettre en place des algo- 
rithmes de changement de base pour manipuler des nombres de grande taille. 

Representation d'entiers 

>» u = -1 

>» u = 23456 

>» u = 2L 

>» u = 826252524370896L 

>» u = 826252524352928685376357642970896L # long, isn't it ? 

Depuis la version 2.4 de Python, lorsque qu'un entier simple depasse la plage auto- 
risee, il est automatiquement transtype, c'est-a-dire converti, en entier long. 

Transtypage automatique en entier long 

>» u = 56 

>» type(u) 

<type 'int'> 

>» u = 3456876534567 

>» type(u) 

<type ' long'> 

La version 3 de Python, quant a elle, ne fait plus de distinction entre ces deux types 
et les unifie en un seul type d'entiers sans suffixes. 
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Manipulation d'entiers sous Python 3 

>» 2L 

File "<stdin>", line 1 
2L 

A 

SyntaxError: invalid syntax 

>» 826252524352928685376357642970896 

826252524352928685376357642970896 

Representation binaire 

La forme binaire (base 2) est obtenue avec le prefixe Ob (zero suivi de b) ou OB. bi n 
permet d'afficher la representation binaire d'un entier. 

Representation binaire 

>» ObOlOllOlOOl 

361 

>» bin (14) 

'OblllO' 

La representation binaire n'existe que depuis Python 2.6. 

Representation octale 

La forme octale est obtenue par une sequence de chiffres de a 7, prefixee d'un Oo 
(zero suivi d'un petit o) ou 00. oct permet d'afficher la representation octale d'un 
entier. 

Exemples de representation octale 

>» u = 0o546 
>» u = 0o76453L 
>» oct(543) 
'01037' 

Cette forme existe depuis Python 2.6, qui supporte encore l'ancienne forme ou le 
chiffre octal etait precede d'un zero simple. 

Representation hexadecimale 

La forme hexadecimale est obtenue par une sequence de chiffres et de lettres de A a E, 
prefixee par la sequence Ox ou OX. La forme la plus courante est d'utiliser le prefixe Ox. 
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Les lettres qui servent a la composition de la valeur peuvent etre en majuscules ou 
minuscules. La notation la plus lisible est l'utilisation de lettres majuscules, combi- 
ners a l'utilisation du prefixe Ox, mais ce choix reste souvent dicte par le domaine. 

Enfin, hex permet d'afficher la representation hexadecimale d'un entier. 
Exemples de notation hexadecimale 

>» u = OX3EF5 
>» u = 0X3EF598L 
>» u = 0x3EF76L 
>» u = 0x3ef7b66L 
>» hex(43676) 
'0xaa9c' 

Litteraux pour les valeurs a virgule flottante 

La representation de valeurs a virgule flottante, que Ton notera litteraux reels, permet 
de decrire des valeurs reelles. Les parties entiere et fractionnelle de la valeur reelle 
sont separees par le signe « . », chaque partie etant composee de chiffres. Si le pre- 
mier chiffre de la partie entiere est 0, le nombre represente ne sera neanmoins pas 
considere comme un octal et restera traite en base 10. 

Representation de reels 



>» 


u 


= .001 


>» 


u 


= 103. 


>» 


U 


= 103.001 


>» 


u 


= -103.2 


>» 


u 


= -.1 


>» 


u 


= -2. 


>» 


u 


= 09.02 



# equivalent a 9.02 

De meme que pour un litteral entier, le signe - peut etre utilise en prefixe pour com- 
poser une valeur negative. 

Une puissance est aussi une valeur a virgule flottante. Elle est representee par une 
partie entiere (ou litteral reel) complete suivie d'un exposant. Lexposant est un suf- 
fixe compose de la lettre e ou E, suivi d'un signe + ou - optionnel et d'un certain 
nombre de chiffres. 

Le module decimal, presente au chapitre 9, permet quant a lui de representer des 
valeurs decimales. 
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Representation de valeurs exponentielles 



>» u = 3.1el0 
>» u = .2E9 
>» u = .2E09 
>» u = 4.2E09 
>» u = 4el0 



Litteraux pour les nombres complexes 

En Python, la representation d'un nombre complexe se fait par l'association de deux 
litteraux reels separes par le signe +. La partie imaginaire est suffixee par la lettre 3 ou 
j. II est aussi possible d'omettre la partie reelle lorsqu'elle est nulle. 

Enfin, les parties reelle et imaginaire peuvent etre consultees par le biais des 
methodes real et imag fournies par les objets de type compl ex. 

Exemples de nombres complexes 



>» u = 5j 




>» u = 3 + 


.3J 


>» u = 6 . 1 


+ 96j 


>» u = 7 + 


34J 


>» u. real 




7.0 




>» u.imag 




34.0 




>» u 




(7+34 j) 





Les types standards 



Python fournit de maniere standard certains types de donnees : 

• les types a valeur unique ; 

• les nombres ; 

• les sequences ; 

• les mappings ; 

• le type file. 

A ces quatre types s'ajoutent les types de donnees accessibles qui seront presentes 
dans le chapitre 6. 
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Les types a valeur unique 

Les types a valeur unique permettent de definir des objets qui jouent un role speci- 
fique dans le langage. Python en fournit trois par defaut : 

• None ; 

• Notlmplemented ; 

• Ellipsis. 

None 

None permet de declarer une absence de valeur et est en quelque sorte comparable au 
nil de Pascal ou au NULL de C. Son usage est tres frequent. II est commun par 
exemple pour certaines variables associees a certaines structures de donnees (les 
classes pour ne pas les nommer) de les initialiser a None. La valeur booleenne de None 
est a Fal se et ce type peut done etre employe dans des expressions de test. 

Notlmplemented 

Dans un algorithme complexe, lorsque certaines combinaisons de parametres ne per- 
mettent pas de calculer un resultat, Notlmplemented peut etre renvoye. Ce type est 
aussi utilise lorsque le code nest pas termine. 



PROGRAMMATION Utilisation de NotlmplementedError 

II est plus frequent d'utiliser NotlmplementedError qui permet de lever une exception dans ce 
genre de cas, afin de ne pas laisser le code appelant continuer (voir le prochain chapitre sur la gestion 
d'exceptions). 



Dans l'exemple ci-dessous, la methode get_data declenche une erreur 
NotlmplementedError pour signifier quelle doit etre surchargee. 

Utilisation de NotlmplementedError 

>» class AbstractData(object) : 
def print_data(self) : 

print (self .get_data()) 
def get_data(self) : 

raise NotImplementedError('A surcharger') 

>» d = AbstractDataO 

>» d.print_data() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 3, in print_data 
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File "<stdin>", line 5, in get_data 
NotlmplementedError: A surcharger 
>» class ConcreteData(AbstractData) : 

def init (self, data): 

self. data = data 
def get_data(self) : 
return self. data 

>» d = ConcreteData('xxx') 

>» d.print_data() 

xxx 



Abstraction Module abc 

Le module abc, introduit dans Python 2.6 et presente au chapitre 10, offre une nouvelle technique de 
description de classes abstraites, comparable aux interfaces. 



Ellipsis 

Ell i psi s est utilise par la notation etendue des tranches, vues a la fin de ce chapitre, 
et par les doctests (voir le chapitre 12, sur la programmation dirigee par les tests). 



Les nombres 

Les nombres sont des objets immuables representes par les litteraux numeriques. 
On retrouve done les trois types, soit : 

• les nombres entiers ; 

• les nombres a virgule flottante ; 

• les nombres complexes. 

Enfin, un type supplemental complete les nombres a virgule flottante : les decimaux. 

Les nombres entiers 

Le type int 

Les nombres entiers sont codes par le biais du complement a deux sur 32 bits ou plus. 
Le principe de ce codage est de representer les entiers relatifs sur n-1 bits en differen- 
ciant les entiers relatifs positifs ou nuls des entiers relatifs negatifs par le dernier bit : 
pour les positifs et 1 pour les negatifs. Une valeur negative est obtenue en prenant son 
opposee positive et en inversant chaque bit de sa representation, puis en ajoutant 1. 

Cette technique permet de rendre directes certaines operations de bas niveau sur les 
nombres, comme les masquages ou decalages de bits. 
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Le type long 

Les nombres entiers depassant la plage de -2 147 483 648 a 2 147 483 647, definis 
precedemment comme des entiers longs, sont quant a eux codes par le biais d'une 
variante du complement a deux. Cette variante definit une valeur suivant une serie de 
bits de taille indefinie, la memoire disponible etant la seule limite. L'objectif de cette 
representation est de minimiser les problematiques de passages de type long a type 
i nt lors d'operations arithmetiques. 



Python 3 Unification des types long et int 

Les types long et i nt ne sont plus qu'un seul et meme type sous Python 3, et ce nouveau type i nt 
fonctionne sans limites de valeur. 



Le type bool 

II existe enfin un sous-ensemble compose des valeurs et 1, qui permet de definir le 
type booleen. Ce type est represente par deux objets uniques : 

• True ; 

• False. 

Ces objets sont equivalents aux objets et 1 de type i nt. 

Les nombres a virgule flottante 

Les nombres a virgule flottante utilises pour representer des reels sont tous a double 
precision (norme IEEE 754) en Python, soit des nombres codes sur 64 bits. La simple 
precision n'est pas implementee, car le gain en termes de taille memoire et de temps 
CPU est ridicule par rapport aux autres consommations d'un programme Python. 



Culture La norme IEEE 754 

La norme IEEE 754, reprise par la norme internationale IEC 60559, definit le format des nombres a vir- 
gule flottante et est adoptee par la quasi-totalite des architectures d'ordinateur actuelles. Les proces- 
seurs integrent directement des implementations materielles pour le calcul sur les flottants IEEE, ce qui 
rend leur usage rapide. Les flottants IEEE sont codes en « simple precision » sur 32 bits ou en « double 
precision » sur 64 bits. Le seul interet de la simple precision est un gain relatif de memoire et de temps 
CPU, ce qui est devenu accessoire avec la puissance des machines actuelles. 

Le principe de la virgule flottante est de definir le nombre reel par un signe, une mantisse entiere ou signifi- 
cande qui represente le nombre complet, et I'exposant qui determine la place de la virgule dans le nombre. 
Les flottants demeurent une approximation rationnelle des nombres reels, et posent quelques problemes. 
Le principal est que des arrondis peuvent se cumuler dans les calculs et introduire des erreurs dramati- 
ques dans certains domaines comme le calcul scientifique ou la comptabilite. L'utilisation des flottants y 
est done proscrite, et remplacee par des entiers. 
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Les nombres complexes 

Les nombres complexes sont formes d'un couple de nombres a virgule flottante et 
subissent done les memes contraintes. 

Les decimaux 

Introduits dans Python 2.4, les decimaux permettent de combler les limitations des 
nombres a virgule flottante dans la representation de certaines fractions. Contraire- 
ment aux types precedents, definir un decimal ne peut pas se faire directement et il 
est necessaire d'utiliser explicitement le module decimal. Ce module et son utilisa- 
tion sont decrits dans le chapitre 8. 

Les sequences 

Une sequence est une collection finie d'elements ordonnes, indexes par des nombres 
positifs. Ces nombres varient de a n-1 pour une sequence contenant n elements. La 
notation pour se referer au i eme element de la sequence est : 

I sequence[i-l] 

II est aussi possible d'utiliser des index negatifs pour se referer aux elements, en les 
faisant varier de -n a -1. Le dernier element de la sequence devient : 

I sequence[-l] 

et le premier : 
I sequence[-n] 

Les elements d'une sequence peuvent etre decoupes en tranches en formant des 
sous-sequences. Par exemple, sequence [u:v] est une sequence qui est une sous- 
partie de sequence, de 1' element d'index u inclus, a 1' element d'index v exclus. La 
nouvelle sequence obtenue devient une sequence a part entiere et de meme type. La 
notation de certaines tranches est simplified par la double indexation positive et 
negative vue precedemment. Par exemple, obtenir la tranche qui contient tous les 
elements d'une sequence, excepte le premier et le dernier se note : 

I sequence[l:-l] . 

II existe un systeme de tranches etendu pour certains types de listes qui permet 
d'inserer un troisieme parametre qui definit le pas. sequence [u : v :w] est equivalent a 
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sequence [u:v] mais seuls les elements multiples de w seront conserves, c'est-a-dire 
que pour tout index i superieur ou egal auet inferieur a v, sequence [i] sera con- 
serve si i = u + n*w. 

Python fournit quelques primitives de manipulation communes a tous les types de 
sequences : 

• 1en() : permet de recuperer le nombre d'elements de la sequence ; 

• mi n() et max() : renvoient les elements de valeurs minimum et maximum ; 

• sum() : renvoie la somme des elements, lorsque tous les elements de la liste ont 
des types qui peuvent etre additionnes. 

II existe deux sortes de sequences : 

• les sequences immuables, qui ne peuvent plus etre modifiees apres creation ; 

• les sequences modifiables. 

Les sequences immuables 

Les sequences immuables sont des objets dont la valeur ne peut plus etre modifiee 
apres creation. 

Ce sont : 

• les chaines de caracteres de type str nominees string ; 

• les chaines de caracteres Unicode, nominees Unicode ; 

• les listes immuables d'elements heterogenes, de type tuple et nominees tuples ; 

• le nouveau type bytes ; 

• le type f rozenset. 

strings et Unicode 

Les strings sont des sequences de caracteres. Un caractere est une valeur codee sur 
8 bits, pour representer une valeur comprise entre et 255. Ce qui correspond a un 
signe de la table ASCII (0 et 127) ou de la table etendue (128 a 255) pour les valeurs 
superieures. 

Contrairement a d'autre langages, il n'existe pas en Python de type specifique pour 
un caractere, et un caractere n'est rien d'autre qu'une sequence stri ng de longueur 1. 
II existe cependant deux primitives specifiques aux caracteres, qui permettent de faire 
la conversion entre le caractere et sa valeur entiere : ord() et chr(). 

Utilisation de chr() et ord() 

>» chr(97) 
'a' 
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>» ord('z') 

122 

>» ord('Z') 

90 

>» chr(90) 

'Z' 

Les chaines Unicode fonctionnent de la meme maniere, mais ont une plage de 
valeurs plus etendue, puisqu'un signe Unicode peut representer une valeur sur 16 ou 
32 bits. II n'existe pas de fonction chr() pour les chaines uni code, mais une fonction 
specifique unichrO. La conversion inverse reste possible avec ord(). 

La conversion entre chaines string et Unicode est possible grace aux methodes 
encodeO et decodeO et aux primitives unicodeO et str(). Le principe de conver- 
sion est relativement simple : 



Figure 4-1 

Schema de correspondance 
unicode-string 




Unicode 



string 



codecs 



ISO-8859-15 



abcdefghijklm 
pqrstuvwxy?.... 




1SO-2022-KR 


ISO-20.... 






abLiitfghijklm 
pqrstuvwxy?.... 


abcdef. 

pqrstuvwxyz... 



Une chaine Unicode peut etre convertie en sa correspondance en string avec la 
methode encode () ou la fonction str(). Cette correspondance n'est pas bijective, 
puisque l'Unicode est en quelque sorte un regroupement de toutes les tables de carac- 
teres existantes. II est done necessaire d'utiliser pour la conversion une table de cor- 
respondance, nommee codec, qui permet de convertir une chaine Unicode en son 
equivalent en fonction d'un jeu de caracteres donne. Ce jeu de caracteres est speci- 
fique a chaque groupe alphabetique de langues et celui utilise pour le francais est 
l'ISO-8859-15. Si l'une des valeurs Unicode n'existe pas dans le codec utilise, une 
erreur UnicodeEncodeError est retournee. 
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Essais d'encodage 



>» encode = u'je m\'apprete a etre encode' .encode('ISO-8859-15 ') 

>» print(encode) 

je m'apprete a etre encode 

>» u'je m\'apprete a etre encode' .encode('ISO-2022-KR') 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
UnicodeEncodeError: 'iso2022_kr' codec can't encode character u'\xea' in 
position 9: illegal multibyte sequence 



A RETENIR Utilisation de str pour les conversions de chaines 

La primitive str n'a pas ete utilisee ici car elle ne permet pas de convertir une chaine Unicode vers 
une chatne stri ng uniquement avec le codec par defaut, c'est-a-dire asci i . Si la chatne uni code 
n'avait ete composee que de caracteres de la table asci i , cette conversion aurait fonctionne. 



La conversion de chaine string vers Unicode, appelee decodage, est basee sur le 
meme principe. 

Essais de decodage 

>» string = 'je m\'apprete a etre decode, j\'ai peur' 

>» string. decode('ISO-8859-15') 

u"je m'appr\xeate \xeO \xeatre d\xe9cod\xe9, j'ai peur" 

>» unicode(string, 'ISO-8859-15 ') 

u"je m'appr\xeate \xeO \xeatre d\xe9cod\xe9, j'ai peur" 

La primitive uni code peut etre utilisee au meme titre que la methode decode, car elle 
prend en deuxieme parametre le nom du codec, contrairement a str. 

Opera teur d' interpolation 

Les objets de type string et Unicode possedent un operateur d'interpolation, ou 
operateur de formatage, qui permet de convertir des marqueurs disposes dans la 
chaine de caracteres par des valeurs fournies a la suite. 

Lecriture est de la forme ob jet Unicode ou string % valeurs, ou valeurs est un 
tuple contenant l'ensemble des valeurs a utiliser dans le formatage. 

S'il n'y a qu'une seule valeur, l'element peut etre directement place apres l'operateur 
modulo. 
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Formatage de chaTne 

>» print("Bonjour Madame %s" % ' Plan ndozei lie') 

Bon jour Madame Plaindozeille 

>» print("Cet objet coute %d euros, Madame %s" % (234, 

' PI ai ndozei "He')) 

Cet objet coute 234 euros, Madame Plaindozeille 

A chaque expression precedee d'un %, appele marqueur de formatage, doit corres- 
pondre une valeur de formatage dans le tuple fourni. 

L'expression est de la forme %[P]c, ou c est un caractere qui determine le type de 
valeur et P un eventuel parametre supplemental, indiquant la precision a utiliser 
pour la valeur a formater. 

La precision est representee par un entier prefixe par un point, qui specifie le nombre 
de chiffres significatifs apres la virgule. 

Les caracteres de formatage sont : 

• %d : entier decimal signe ; 

• %o : octal non signe ; 

• %u : decimal non signe ; 

• %x ou %X : valeur hexadecimale, prefixee respectivement par Ox ou OX ; 

• %e ou %E : valeur a virgule flottante, de la forme xev ou xEv ; 

• %f ou F% : reel ; 

• %g ou %C : pour les valeurs a virgule flottante, equivalent a %e ou %E si l'exposant 
est superieur a -4 ou inferieur a la precision, sinon equivalent a %f ; 



• %c 

• %r 

• %s 

• %% 



un seul caractere (sous la forme d'un string ou d'un entier) ; 
renvoie le resultat de la primitive repr() ; 
renvoie le resultat de la primitive str() ; 
permet d'utiliser le caractere % dans une chaine formatee. 



Exemples de formatages 

>» print('%.2f euros' % 2.394765) 

2.39 euros 

>» print('%E euros' % 2.394765) 

2.394765E+00 euros 

>» print('%s euros' % '2.394') 

2.394 euros 

>» print('%d euros' % 2.394) 

2 euros 

Cette notation s'avere parfois complexe lorsqu'il y a beaucoup d'elements a rem- 
placer, et il est possible d'utiliser des formatages nommes avec un dictionnaire. 
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Formatage par methode classique puis par dictionnaire 



>» "Remplacement de %s par %s. Out %s par %s, vraiment %s." % \ 

... ('ce mot', 'ce mot-ci ' , 'ce mot', 'ce mot-ci ' , 'ce mot-ci') 

'Remplacement de ce mot par ce mot-ci. Out ce mot par ce mot-ci, 

vraiment ce mot-ci.' 

>» ("Remplacement de %(old)s par %(new)s. Oui %(old)s par %(new)s, " 

... "vraiment %(old)s." % {'old': 'ce mot', 'new': 'ce mot ci'}) 

'Remplacement de ce mot par ce mot-ci. Oui ce mot par ce mot-ci, 

vraiment ce mot. ' 

Le formatage « %s » devient « %(label)s » ou label est une cle dans le dictionnaire 
passe a l'operateur « % ». 

Tuples 

Les tuples sont des sequences qui contiennent des elements de types heterogenes. 
Chacun des elements est separe par une virgule et l'ensemble est defini par des 
parentheses. Une fois l'objet cree, il est impossible de modifier sa valeur. Cette con- 
trainte permet d'utiliser ce type d'objet dans des cas de programmation precis que 
nous verrons par la suite. Pour pouvoir modifier les elements d'un tuple, il faut done 
en creer un nouveau qui le remplacera. 

Les tuples composes d'un seul element ont une ecriture un peu particuliere puisqu'il 
est necessaire d'ajouter une virgule apres l'element, sans quoi l'analyseur syntaxique 
de Python ne le considerera pas comme un tuple mais comme l'element lui-meme, et 
supprimera les parentheses qu'il analyserait comme superflues. 

Manipulation de tuples 

>» tupleO 



>» tuple('a') 

('a',) 

>» color_and_note = ('rouge', 12, 'vert', 14, 'bleu', 9) 

>» colors = color_and_note[: :2] 

>» print(colors) 

('rouge', 'vert', 'bleu') 

>» notes = color_and_note[l: :2] 

>» print(notes) 

(12, 14, 9) 

>» color_and_note = color_and_note + ('violet',) 

>» print(color_and_note) 

('rouge', 12, 'vert', 14, 'bleu', 9, 'violet') 

>» print ('violet') 

violet 

>» print('violet ' ,) 

('violet' ,) 
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L'oubli de la virgule dans un tuple a un element, pour differencier ('violet' ,) de 
' vi ol et ' , est une erreur courante de programmation. 

bytes 

Le type bytes est sous Python 2.6 un simple alias vers le type str. II permet une 
transition en douceur vers Python 3. 

II devient reellement different dans Python 3 et permet de manipuler des entiers de 
a 127 correspondants a la table ASCII. II peut etre initialise par des valeurs dans une 
sequence prefixee de b, ou par une chaine de caracteres de type str. 

Manipulation de bytes sous Python 3 

>» data = b'\xcl\xc2' 

>» data 

b'\xcl\xc2' 

>» data = b'some bytes' 

>» data 

b'some bytes' 

Pour etre initialise avec un objet de type str, il est necessaire d'utiliser le constructeur de 
bytes et de preciser l'encodage de la chaine pour que Python puisse traduire la chaine. 

Initialisation avec une simple chame 

>» data = bytes('some bytes', 'utf-8') 
>» data 
b'some bytes' 

frozenset 

Le type frozenset est une version immuable du type set. II est presente avec le type 
set dans la prochaine section. 

Les sequences modifiables 

Les sequences modifiables implementent un certain nombre de methodes qui permet- 
tent d'aj outer, de supprimer ou de modifier chacun des elements qui les composent. 

Le langage propose plusieurs types de sequences modifiables : 

• 1 i st, le type le plus classique ; 

• bytearray, qui permet de manipuler des bytes ; 

• set, qui definit une sequence non ordonnee ; 

• array, qui implemente une liste d' elements homogenes simples, comme les entiers 
ou chaines de caracteres, du moment qu'ils sont dans la bibliotheque standard. 
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Le type list 

Dans une liste, chaque element est separe par une virgule et l'ensemble est entoure 
par des crochets. Une liste vide se note done []. 

Manipulation de list 

>» list() 

[] 

>» listC'1234') 

['1', '2', '3', '4'] 

>» [1, 2, 3] 

[1, 2, 3] 

Le tableau ci-dessous regroupe l'ensemble des methodes applicables aux listes, et 
complete les primitives communes a toutes les sequences. Pour les methodes, les 
parametres optionnels sont notes en italique : 





Tableau 4-2 Methodes pour les listes 




Norn 


Description 


Exemple 




append(e) 


Permet d'ajouter un element e en fin de 


>» a = [1, 3, 'b'] 






liste. 


>» a.append('t') 
>» print (a) 

[1, 3, 'b\ 't'] 




extend(L) 


Permet d'ajouter les elements d'une 


>» a = [1, 2, 3] 






seconde liste L en fin de liste. 


>» b = [4, 5] 
>» a. extend (b) 
>» print (a) 

[1, 2, 3, 4, 5] 




insert(p, e) 


Permet d'inserer un element e a une 


>» a = [ ' o ' , ' j ' , ' o ' , ' u ' 


, 'r'] 




position p. La position correspond a 


>» a.insert(0, 'b') 






une insertion en debut de liste. 


>» a.insert(2 , 'n') 
>» print (a) 








['b' , 'o\ 'n', 'j' , 'o', ' 


u', 'r'] 


remove (e) 


Retire le premier element de la liste qui a 


>» a = [1, 2, 3] 






la meme valeur que celle fournie. Si 


>» a. remove(2) 






aucun element n'esttrouve, une erreur 


>» print (a) 






est retournee. 


[1, 3] 

>» a. remove(2) 








Traceback (most recent call 


last) : 






File "<stdin>", line 1, in 






<module>? 








ValueError: list . remove (x) : 


x not i n 






list 
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Tableau 4-2 Methodes pour les listes (suite) 



Norn 


Description Exemple 




pop O") 


Retire I'element d'index i de la listeetle >» a = [1, 2, 3] 
renvoie. Si i n'est pas fourni, c'est le der- >» a. pop(l) 
nier element qui est retire. 2 








>» a.popO 
3 








>» a 








[1] 




index (e) 


Renvoie I'index du premier element dont 


>» a = [1, 2, 3, 2] 






la valeurest e. Uneerreurest renvoyeesi »> a.index(2) 






e n'est pas trouve. 1 

>» a.index(17) 






JTraceback (most recent call last) 






File "<stdin>", line 1, in 






<module>? 








ValueError: list.index(x) : x not 


in 






list 




count(e) 


Indique le nombre d'occurrences de I'ele- >» a = [1, 2, 3, 2] 
mente. >» a.count(2) 

2 

>» a.count(l) 












>» a.count(17) 





sort(fonc) 


Trie les elements de la liste. Le parametre >» a = [4, 1, 2, 3] 

optionnel fonc est un nom defonction >» a.sort() 

qui sera utilise pour comparer deux a >» a 

deux les elements de la liste. S'il est omis, [1> 2, 3, 4] 






un tri par defaut base sur les valeurs bru- 
tes des elements est applique. 
Le principe de comparaison par valeurs 
brutes sera explicite dans le chapitre trai- 
tant des operateurs. 


>» a = ['c', 'ihfqe', 'ef'] 
>» def size_sort(el, e2) : 
... if len(el) > len(e2): 

return 1 
... if len(el) < len(e2): 

return -1 
return 

>» a.sort(size_sort) 
>» a 

['c', 'ef, 'ihfqe'] 




reverseQ 


Retoume la liste. Le premier element >» a = [2, 0, 0, 5] 
devient le dernier, le deuxieme >» a. reverse () 






I'avant-dernier, etc. 


>» a 

[5, 0, 0, 2] 
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A SAVOIR Supprimer directement un element d'une sequence 

Pour supprimer directement I'element d'index i d'une sequence s modifiable, il est possible d'utiliser la 
primitive del en utilisant la notation : del s [i ] 



bytearray 

Le type bytearray est equivalent au type bytes mais permet de modifier les don- 
nees. II s'instancie avec une liste d'entiers, une chaine binaire ou une chaine classique 
du moment que l'encodage est fourni. 

Initialisation d'un bytearray 

»> array = bytearray([l, 78, 76]) 

>» array 

bytearray (b ' \x01NL ' ) 

>» bytearray (b' some data') 

bytearray(b'some data') 

>» bytearray('some data', 'utf8') 

bytearray(b'some data') 

bytearray implements certaines methodes du type str, comme startswith, 
endswith ou encore find. 

II permet aussi de manipuler les donnees comme une sequence, et implements cer- 
taines methodes de list, comme append, pop ou encore sort. 

Manipulation de bytearray 

>» array = bytearray([l, 78, 76]) 

>» array .startswith(b'\x01') 

True 

>» array[2] 

76 

>» array .append(12) 

>» array 

bytearray (b ' \x01NL\x0c ' ) 

>» array . reverse() 

>» array 

bytearray (b ' \x0cLN\x01' ) 

set 

Le type set est une sequence non ordonnee d'objets hashable uniques. Un objet has- 

hable est un objet qui implements la methode speciale hash , qui renvoie une 

valeur unique pendant toute la duree de vie de l'objet. En d'autres termes, les objets 
hashable sont tous des objets de valeur constante. 
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La primitive hash permet de renvoyer la valeur retournee par methode hash de 

l'objet et de provoquer une erreur si l'objet n'en a pas, c'est-a-dire s'il n'est pas constant. 

Manipulation de hash 

>» hash('some string') 

-604248944 

>» hash('some string') 

-604248944 

>» hash (12) 

12 

>» hash([l, 2]) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: unhashable type: 'list' 

Cette restriction permet a set d'etre beaucoup plus performant qu'une sequence 
classique pour certains operateurs, comme in, car il construit en memoire un index 
des elements. 

Operateur in sur set et list 

>» 1 in [1, 2,3] # complexite 0(n*n) 

True 

>» 1 in set([l, 2, 3]) # complexite 0(n) 

True 

Les methodes disponibles avec set sont celles des sequences. 

f rozenset est un sous-type de set qui est immuable et permet de figer le contenu de 
la sequence et d'offrir de nouvelles methodes de comparaisons puissantes et rapides. 



Les mappings 



Le mapping est une collection d'elements qui sont identifies par des cles uniques. II 
n'y a done dans ce cas aucune notion d'ordre comme dans les listes. La notation est la 
meme que pour les sequences, et 1' element e du mapping map associe a la cle cle se 
recupere par la commande : 

e = map[cle] 

On peut utiliser les memes primitives que pour les sequences sur un mapping, soit 
max, mi n et 1 en. En realite, ces operations s'appliqueront sur la sequence equivalente a 
l'ensemble des cles qui composent le mapping. 
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Python propose un type de mapping di ct (appele dictionnaire), sachant qu'il est tout 
a fait possible d'implementer son propre type de mapping comme le module array 
de la bibliotheque standard le fait pour les sequences. 

Dans les dictionnaires, la cle associee a un element doit etre un objet de type 
immuable, comme un entier ou une chaine de caracteres. II est possible d'utiliser un 
tuple comme cle a condition que les elements qui le composent soient tous immua- 
bles. Cette contrainte permet aux mecanismes internes du dictionnaire de traduire la 
cle en une valeur constante, en utilisant hash , qui sera ensuite utilisee pour accelerer 
tous les acces aux elements. 

Chaque element d'un dictionnaire est separe par une virgule et l'ensemble est 
entoure par des accolades. Un dictionnaire vide se note done {}. Pour representer un 
element de dictionnaire, on le prefixe de sa cle suivie de deux points. L'element e de 
cle cle se note done cle: e, et un dictionnaire compose de deux elements del: el 
etcle2: e2 se note: {clel: el, cle2: e2} 

Exemples de dictionnaire 

>» dicol = {'a' : 1, 2: 'b'} 

>» dicol ['a'] 

1 

>» dicol [2] 

'b' 

>» 1 en (dicol) 

2 

>» dict() 

{} 

>» dictCCC'a', 1), C'b', 2), C'C, 3))) 

{'a': 1, 'c': 3, 'b': 2} 

Tout comme les listes, les objets de type dictionnaire proposent un certain nombre de 
methodes regroupees dans le tableau ci-dessous : 





Tableau 4-3 Methodes pour les dictionnaires 






Norn 


Description Exemple 






clearQ 


Supprime tous les elements du diction- 
naire. 


>» dicol 
>» dicol. 
>» dicol 
{} 


= {'a': 1, 'b': 2} 
clearQ 
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Tableau 4-3 Methodes pour les dictionnaires (suite) 



Norn 


Description 


Exemple 




copyO 


Renvoie une copie par references du dic- 
tionnaire. 


>» dico = {'1': ' r\ '2': [1 
>» dico2 = dico.copyO 


,2]} 




Lire la remarque sur les copies un peu plus 
bas. 


>» dico2 

{'1': 'r', '2': [1, 2]} 

>» dico['2'] .append('E') 

>» dico2['2'] # dico2 est aussi 






impacte 
[1, 2, 'E'] 




has_key(cle) 


Renvoie vrai si la cle fournie existe. Equiva- 
lent a la notation : 


>» dico = {'a': 1, 'b' : 2} 
>» dico.has_key('a') 






cle in dictionnai re. 
cle not in dictionnai re est 
I'equivalent de I'inverse, soit not 
has key(cle). 


True 

>» dico.has_key('c') 

False 

>» 'a' in dico 

True 

>» 'c' not in dico 

True 




i terns () 


Renvoie sous la forme d'une liste de tuples, 


>» a = {'a': 1, 'b' : 1} 






des couples (cle, valeur) du dictionnaire. 
Les objets representant les valeurs sont 
des copies completes et non des referen- 
ces. 


>» a. i terns 
[('a', 1), ('b', 1)] 




keysO 


Renvoie sous la forme d'une liste I'ensem- 
ble des des du dictionnaire. L'ordre de ren- 
voi des elements n'a aucune signification 
ni Constance et peut varier a chaque modi- 
fication du dictionnaire. 


>» a = {(1, 3): 3, 'Q': 4} 
>» a. keys O 
['Q', CI, 3)] 




valuesO 


Renvoie sous forme de liste les valeurs du 


>» a = {CI, 3): 3, 'Q': 4} 






dictionnaire. L'ordre de renvoi n'a ici non 


>» a.valuesC) 






plus aucune signification mais sera le 
meme que pour keys () si la liste n'est 
pas modifiee entre-temps, ce qui permet 
de faire des manipulations avec les deux 
listes. 


[4, 3] 




iteritems() 


Fonctionne comme items () mais renvoie 
un iterateur sur les couples (cle, valeur). 


>» 1 = {1: 'a', 2: 'b', 3: ' 

>» i = 1 .iteritemsC) 

>» i .nextO 

CI, 'a') 

>» i .nextO 

C2, 'b') 

>» i .nextO 

C3, 'c') 


c'} 
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Tableau 4-3 Methodes pour les dictionnaires (suite) 






Norn 


Description 


Exemple 






iterkeysO 


Fonctionne comme keys() mais renvoie 


>» 1 = {1: 'a', 2: 


'b', 3: 


'c'} 




un iterateur sur les cles. 


>» cles = 1. iterkeysO 








>» cles. next 

1 

>» cles.nextO 

2 

»> cles.nextO 

3 






















itervaluesO 


Fonctionne comme val ues () mais ren- 


»> values = 1 .itervaluesO 






voie un iterateur sur les valeurs. 


>» values.nextO 

'a' 

>» values.nextO 

'b' 

>» values.nextO 

'c' 






















get(cle, 


Renvoie la valeur identified par la cle 


>» 1 = {1: 'a' , 2: 


'b', 3: 


'c'} 


default} 


cl e . Si la cle n'existe pas, renvoie la 
valeur def aul t fournie. Si aucune valeur 
n'est fournie, renvoie None. 


>» 1 .get(l) 

'a' 

>» 1 .get(13) 

>» l.get(13, 7) 

7 






pop(cle, 


Renvoie la valeur identifiee par la cle cl e 


>» 1 = {1: 'a', 2: 


'b', 3: 


'c'} 


default') 


et retire I'element du dictionnaire. Si la cle 
n'existe pas, pop se contente de renvoyer 
la valeur default. Si le parametre 
def aul t n'est pas fourni, une erreur est 
levee. 


>» 1 .pop(l) 

'a' 

>» 1 

{2: 'b\ 3: 'c'} 

>» 1 .pop (13, 6) 

6 

>» 1 

{2: 'b', 3: 'c'} 

>» 1 . pop(18) 










Traceback (most recent call 








last): 










File "<stdin>", 1 


ine 1, in 


? 






KeyError: 18 






popitemO 


Renvoie le premier couple (cle, valeur) du 
dictionnaire et le retire. Si le dictionnaire 
est vide, une erreur est renvoyee. L'ordre 
de retrait des elements correspond a 
l'ordre des cles retournees par keys () si 
la liste n'est pas modifiee entre-temps. 


>» 1 = {1: 'a', 2: 

>» 1 . popitemO 

(1, 'a') 

>» 1 . popitemO 

(2, 'b') 

>» 1 . popitemO 

(3, 'c') 


'b', 3: 


'c'} 
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Tableau 4-3 Methodes pour les dictionnaires (suite) 



Norn 


Description 


Exemple 






update(dic, 


Update permet de mettre a jour le dic- 


1 = {1: 'a', 2: 


'b', 3: 


c'} 


**dic) 


tionnaire avec les elements du dictionnaire 
di c. Pour les cles existantes dans la liste, 
les valeurs sont mises a jour, sinon creees. 


>» 12 = {3: 'ccc' , 
»> 1 .update(12) 
>» 1 


4: 'd'} 






Le deuxieme argument est aussi utilise 


{1: 'a' , 2: 'b', 3: 


'ccc' , 4 






pour mettre a jour les valeurs. 


'd'} 






setdefault(cle, 


Fonctionne comme get () mais si cl e 


>» 1 = {1: 'a', 2: 


'b', 3: 


c'} 


default) 


n'existe pas et defaul t est fourni, le 
couple (cle, default) est ajoute a la liste. 


»> 1 .setdefault(4, 

'd' 

>» 1 


'd') 








{1: 'a' , 2: 'b', 3: 


'c', 4: 


d'} 


f romkeys(seq, 


Genere un nouveau dictionnaire ety 


>» 1 = {} 






default) 


ajoute les cles fournies dans la sequence 
seq. La valeur associee a ces cles est 
def aul t si le parametre est fourni, 
None le cas echeant. 


»> 1 . f romkeys([l, 
{1: 0, 2: 0, 3: 0} 


2, 3], 0) 





A RETENIR Copie legere et copie complete 

Les copies de type shallow sont litteralement des copies legeres. Chaque reference aux objets du diction- 
naire est recopiee et les changements des objets modifiables sont done visibles dans chaque copie origi- 
nelle du dictionnaire. 

A I'inverse, les copies completes, notees deepcopy, fabriquent une copie conforme en scrutant et reco- 
piant recursivement tous les elements contenus dans les objets modifiables du dictionnaire. Pour la 
methode i terns, une copie complete est effectuee dans la liste resultante, ce qui n'est pas le cas de 
copy. 

Nous verrons dans les exercices du chapitre 9 qu'il existe un systeme generique de copie complete, dans 
le module copy , qui offre la possibility d'implementer ce mecanisme pour tout type d'objet. 



A SAVOIR Les iterateurs 

Les iterateurs, qui seront plus largement abordes dans la partie de description de la fonction yi el d, et 
les generateurs, sont des objets qui permettent de parcourir une sequence sans que les elements qui la 
constituent ne soient connus au prealable. Le principe est equivalent a un curseur de donnees place sur la 
premiere donnee et qui decouvre les elements au fur et a mesure de I'avancee dans la sequence. Ce 
mecanisme permet d'optimiser grandement la vitesse d'execution pour des cas d'utilisation specifiques. 
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Les operateurs 

Cette section presente l'ensemble des operateurs disponibles en Python, ainsi que les 
regies qui les gerent, comme l'ordre de traitement par l'interpreteur des elements 
d'une operation. 

Operateurs de base 

Les operateurs de base que sont 1' addition, la soustraction et la multiplication, fonc- 
tionnent de maniere tout a fait classique en Python. La division est particuliere : his- 
toriquement, cet operateur fonctionne exactement comme celui du langage C. Ainsi, 
lorsque les deux operandes de la division sont des entiers, le resultat est toujours un 
nombre entier, ce qui peut etre relativement perturbant. Pour eviter ce probleme, il 
est necessaire de transformer l'un des operandes en nombre a virgule flottante. 



issais de division 


>» 


5/6 







>» 


C-D/2 


-1 




>» 


-1/2 


-1 




>» 


-1/2.5 


-0. 


40000000000000002 


>» 


-1/6 


-1 




>» 


-Float(l)/f"loat(6) 


-0. 


16666666666666666 


>» 


-float(l)/6 


-0. 


16666666666666666 



Cette particularite, qui existe depuis le debut du langage a ete souvent decriee par la 
communaute et par Guido van Rossum lui-meme. Un des objectifs de la version 3 de 
Python est de voir disparaitre ce fonctionnement au profit d'un principe plus clas- 
sique. Ce changement etant relativement lourd pour le langage, il est introduit par 
petites etapes successives depuis la version 2.2. 

La premiere etape a consiste a introduire un nouvel operateur note // et voue a rem- 
placer a terme l'actuel operateur / . Loperateur // est done la division entiere mais 
fonctionne de la meme maniere pour tous les types d'operandes. Ainsi, 1.0 // 4.0 
est bien equivalent a . 0, contrairement a 1 . / 4.0 qui vaut 0.25. 

La deuxieme etape offre la possibilite d'implementer des a present le futur fonctionne- 
ment de la prochaine version 3.0, par le biais d'une directive d'importation speciale. 
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Passage en mode division reelle 



>» from future import division 

>» 1 / 4 

0.25 

>» 1 / 5 

0.20000000000000001 

>» 1.0 / 4 

0.25 



Avenir Le module future 

f utu re est un module particulier de Python qui regroupe un certain nombre d'elements appeles fea- 
tures. Ce sont des fonctionnalites du langage qui n'existent pas encore dans la version en cours, mais qui 

peuvent d'ores et deja etre testees et utilisees dans les programmes actuels. future indique pour 

chaque fonctionnalite a partir de quelle version elle peut etre utilisee, et a quelle version elle sera ajoutee. 

>» future .division 

_Feature((2, 2, 0, 'alpha', 2), (3, 0, 0, 'alpha', 0), 8192) 



Autres operateurs 

On compte comme autres operateurs : 

• modulo ; 

• negation ; 

• inversion ; 

• puissance ; 

• appartenance ; 

• operateurs binaires. 

Modulo 

L'operation modulo est effectuee par l'operateur % ou par la primitive di vmod qui ren- 
voie le quotient de la division et son reste. 

Calculs de modulos 

>» 10 % 8 

2 

>» di vmod (10, 8) 

CI, 2) 
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Negation 

II est possible en Python d'appliquer la negation directement sur des variables. 
Negation directe 

>» val =56 
>» -val 
-56 

Inversion 

L'inversion bit a bit, soit l'equivalent de -(n+1) pour tout n entier ou entier long, se 
fait par le biais du signe tilde (~). 

Inversion 

>» ~9 

-10 

Puissance 

L' exponentiation s' applique avec l'operateur **. Lorsque les deux operandes sont des 
entiers et que le resultat depasse la plage des entiers, il est automatiquement trans- 
forme en entier long. Pour le cas des nombres a virgule flottante, une erreur de 
depassement est renvoyee. 

Essais sur les puissances 

>» 10 ** 10 

10000000000L 

>» 1.8 ** 10 

357.0467226624001 

>» 1.8 ** 1034 

8.9489128117168538e+263 

>» 1.8 ** 134534 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module>? 
Overflow/Error: (34, 'Numerical result out of range') 

Appartenance 

L'operateur d'appartenance i n sert a verifier qu'une sequence possede un element 
dont la valeur est egale a celle de l'objet fourni. Cette operation s' applique a tous les 
types de sequences et est equivalente a cette fonction : 
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Fonction similaire a I'operateur in 

def is_in (element, elements): 

"""Teste 1 'appartenance d'un element a une liste.""" 
for elt in elements: 
if elt == element: 
return True 

return False 

Pour les sequences de type string ou Unicode, l'objet doit etre lui-meme de type 
Unicode ou string. Bien que les deux operandes puissent etre dans ce cas de types 
differents (string in Unicode ou Unicode in string), il est conseille de rester 
homogene afin d'eviter des erreurs de transtypage, puisque les deux operandes sont 
toujours compares dans le meme type. En cas de probleme, Python gere ce cas parti- 
culier en provoquant une erreur specifique. 

Melange des genres, erreur au tournant 

>» sequence = u' Brian' 

>» i = 'e' 

>» i in sequence 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module>? 
TypeError: 'in <string>' requires string as left operand 
>» i = ' i ' 
>» i in sequence 
True 

Nous verrons dans les chapitres suivants qu'il est possible d'integrer ce mecanisme a 
tout type d'objet en implementant des methodes aux noms specifiques. 



A RETENIR 


Appartenance et dictionnaires 




Python 2.3 a introduit un nouveau mecanisme qui permet de faire fonctionner directement les dictionnai- 


res avec 


'operateur d'appartenance, en lui passant les des implicitement. 




Les deux ecritures deviennent possibles, avec une preference pour I'ecriture 


abregee : 


>» c 


ic = {'a': 1, 'b': 2} 




>» ' 


a' in die. keys () 




True 






>» ' 


a' in die 




True 
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Operateurs binaires 

Les operations binaires qui s'effectuent sur des entiers ou des entiers longs sont : 

• & : operateur logique ET, note AND ; 

• | : operateur logique OU, note OR ; 

• a : operateur logique OU EXCLUSIF, note XOR. 

Table de verite de I'operateur logique ET 

>» [1 & 1, 1 & 0, & 1, & 0] 
[1, 0, 0, 0] 

A ceux-ci s'ajoutent les operateurs de decalage de bits vers la gauche et vers la droite : 
Decalages de bits 

>» a = 16 

>» a = a « 2; print a 

64 

>» a = a « 2; print a 

256 

>» a = a « 2; print a 

1024 

Un decalage de n bits vers la droite est equivalent a une division par pow(2 , n) et un 
decalage de n bits vers la gauche a une multiplication par pow(2 , n). Cette ecriture 
est en outre beaucoup plus rapide a l'execution. 



Operateurs de comparaison 

En Python, les comparaisons sont accomplies par les operateurs suivants : 
< : inferieur strictement ; 
> : superieur strictement ; 
<= : inferieur ou egal ; 
>= : superieur ou egal ; 
== : egal ; 

! = ou <> : different de ; 
is : est ; 
i s not : n'est pas . 

! = et <> sont equivalents pour tester la difference, mais la premiere ecriture est celle a 
retenir, car <> est devenu obsolete meme s'il est encore utilisable. 
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Principes de la comparaison 

Une comparaison travaille sur deux objets et renvoie un resultat booleen. A 1' excep- 
tion des types numeriques qui peuvent etre convertis vers un type commun, si les 
deux objets sont de types differents, l'egalite est toujours fausse et leur ordonnance- 
ment nest pas interpretable mais reste constant. 

Dans le cas de types d'objets equivalents, la comparaison est : 

• arithmetique pour les types numeriques ; 

• lexicographique pour les chaines de caracteres, sans distinction entre Unicode et 
string ; 

• lexicographique pour les sequences, en comparant chaque element en fonction de 
son type ; 

• lexicographique pour les mappings, en comparant chaque couple (cle, valeur) 
apres 1' application d'un tri ; 

• identitaire pour l'operateur i s, le resultat n'etant vrai que si les deux operandes 
sont le seul et meme objet. 



Avenir Evolution de la comparaison 

Le raccourci applique a la comparaison de types differents evoluera certainement dans les prochaines 
versions de Python au profit d'un principe moins radical. 



Ordre de traitement des operations 

Lorsque plusieurs operateurs entrent en jeu dans une expression, l'interpreteur utilise 
l'ordre d'interpretation dit « PEDMAS » (abreviation de « Parentheses, Exposants, 
Division, Multiplication, Addition, Soustraction ») qui reprend les lois associatives 
et commutatives de l'algebre elementaire. 

Exemples d'operations enchainees 

>» 5 + 3 - 4 

17 

>» (5 + 3) * 4 

32 

>» (5 + 3) * 4 / 2 
16 
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Construction de comparaisons complexes 

Python permet d'enchainer plusieurs comparaisons dans une meme expression pour 
construire des conditions complexes. L'ordre d' evaluation est 1' execution des comparai- 
sons deux a deux, a < b < c < d est done equivalent a a < b and b < c and c < d. 

Comparaisons chaTnees 

>» a = 1 
>» b = 2 
>» c = 3 
>» a < b < c 
True 



L' indentation 

En Python, l'indentation des lignes fait partie integrante de la structure des pro- 
grammes. La ou les langages C et Java utilisent des accolades pour definir des blocs, 
Python se base sur le retrait d'une ligne pour definir son niveau. 

L'interpreteur remplace toutes les tabulations rencontrees entre le debut de la ligne et 
le premier caractere interpretable par un certain nombre d'espaces puis comptabilise 
le nombre d'espaces obtenus. Ce nombre definit un niveau d'indentation. Si le retrait 
augmente a la ligne suivante, le niveau est incremente et la taille de retrait y est asso- 
ciee. Lorsque le retrait diminue, le niveau est decremente en consequence. 

Exemple d'indentation 

def ma_fonctionO :# niveau 
i = 0# niveau 1 
print ' ['# niveau 1 
while i < 10: # niveau 1 
print ' . ' # niveau 2 
i += 1# niveau 2 
print '] '# niveau 1 

Lorsque l'indentation n'est pas respectee, l'interpreteur provoque une erreur et le 
programme s'arrete. 

Decalagede print ']' 

def ma_fonction() : 
i = 
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print ' [' 
while i < 10: 
print ' . ' 

i += 1 
print '] ' 

ma_fonctionO 

[tziade@Tarek ~]$ python etest.py 
File "etest.py", line 7 
print '] ' 

A 

IndentationError : unindent does not match any outer indentation level 

Comme le nombre d'espaces utilises pour remplacer une tabulation peut varier, il est 
necessaire de ne pas melanger les deux caracteres pour indenter les lignes. II est 
d'ailleurs conseille de ne pas utiliser les tabulations comme nous le verrons dans le 
chapitre dedie aux conventions de codage. De plus, cette rigueur d'ecriture assure la 
lisibilite du code. 



Les structures conditionnelles 

Les structures conditionnelles sont des regroupements de lignes delimites par un 
niveau d'indentation et dont le contenu est execute en fonction d'une ou plusieurs 
conditions. On denombre trois structures conditionnelles en Python qui permettent 
d'organiser le code, definies par les instructions : 

• if ; 

• for ; 

• while. 

Chacune de ces structures est de la forme : 



instruction condition: 

bloc de lignes 
else: 

bloc de lignes 

A ces quatre instructions s'ajoutent trois instructions supplementaires qui font l'objet 
d'un chapitre complet : 

• def ; 

• class ; 

• try. 
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[.'instruction if 



L'instruction i f (« si ») est associee a une expression terminee par le caractere : . 
Chaque element de l'expression est evalue tour a tour. Si l'expression evaluee renvoie 
Fal se, l'interpreteur n' execute pas le contenu de la structure. Dans le cas ou revalua- 
tion de l'expression renvoi True, le bloc est execute. 

II est possible de definir un deuxieme bloc delimite par l'instruction el se (« sinon »), 
execute lorsque l'expression renvoie Fal se. 

Exemple d'instruction if 

>» if 1 > 2: 

... print "il est temps d'arreter 1 'ordinateur" 

... else: 

... print "tout va bien" 

tout va bien 

Enfin, l'instruction el i f , forme contractee de else if pour « sinon, si » permet 
d'imbriquer une serie de structures de type i f : chaque condition est testee, et en cas 
de resultat negatif, l'instruction suivante est a son tour evaluee. Ce principe permet 
de mettre en place des structures equivalentes au switch en C et au case en Pascal. 

EnchaTnement avec elif 



>» if 1 > 2: 

print "il est temps d'arreter 1 'ordinateur" 
elif 1 > 3: 

print "il est vraiment temps d'arreter 1 'ordinateur" 
else: 

print "tout va bien" 

tout va bien 



L'instruction for.. in 

L'instruction for permet d'executer un bloc de lignes en fonction d'une sequence. 
Elle est de la forme : 



for variable in sequence: 

bloc de lignes 
else: 

bloc de lignes 
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Si sequence possede n elements, le bloc sera execute n fois, et variable referencera 
1' element sequence [n-1] qui sera accessible dans le bloc. 

Lorsque l'execution est achevee, un bloc de lignes optionnel presente par el se est a 
son tour execute. 

Exemple d'instruction for 

>» for caractere in "bonjour": 
print(caractere) 

b 

o 

n 

J 

o 

u 
r 

Pour les sequences modifiables comme les listes, il est necessaire de prendre des pre- 
cautions en controlant que le code du bloc ne modifie pas sa taille. En effet, Python 
conserve en memoire un compteur pour savoir sur quel element la boucle for se 
trouve. Si la taille de la sequence est modifiee en cours de route, il est possible que le 
bloc ne soit pas execute pour tous les elements, ce qui peut etre relativement genant. 

Le mecanisme de l'instruction for peut paraitre assez deconcertant et la premiere 
question qui vient a l'esprit est : « comment executer simplement un bloc de lignes 
un certain nombre de fois sans avoir a preparer une sequence ». La primitive range () 
repond a ce besoin en generant une sequence de n nombres variant de a n-1. 

Utilisation de range() 



>» range(lO) 
[0, 1, 2, 3, 4, 5, 6, 7, 
>» for i in range(5): 
print(str(i)) 



9] 



Deux instructions supplementaires permettent d'agir sur le deroulement de l'instruc- 
tion for : 
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• conti nue : interrompt l'execution de la boucle pour l'element en cours et passe a 
l'element suivant. Si l'element etait le dernier de la sequence, le contenu de l'ins- 
truction el se est execute s'il existe. Cette instruction est utile dans le cas ou l'ele- 
ment en cours n'est pas concerne par le traitement a effectuer. 

• break : interrompt definitivement l'execution de la boucle et n' execute pas l'instruc- 
tion el se. Cette instruction est utile lorsque Ton cherche a appliquer un traitement 
a un et un seul element d'une liste, ou que cet element est une condition de sortie. 

Utilisation de continue et break 

>» # n'affiche que les nombres pairs 

>» for i in range(5): 
i f i % 2 : 

continue 
print(str(i)) 


2 
4 

>» for i in range(5): 
if i == 4: 

print('4 a ete trouve') 
break 
print('on continue') 

on continue 
on continue 
on continue 
on continue 
4 a ete trouve 



A SAVOIR Fin de boucle 

Lorsque l'execution est terminee, le dernier element de la sequence reste toujours accessible par la varia- 
ble de boucle. 



[.'instruction while 

L'instruction while permet d'executer un bloc de lignes tant qu'une expression est 
verifiee en renvoyant True. Lorsque l'expression n'est plus vraie, l'instruction el se est 
executee si elle existe et la boucle s'arrete. 

continueet break peuvent etre utilises de la meme maniere que pour l'instruction for. 
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Exemple d'utilisation de while 



>» i = 

>» while i < 4: 

print(str(i)) 

i += 1 
else: 

print('end') 



1 

2 

3 

end 

>» i = 

>» while i < 5: 
i += 1 
if i == 2: 

continue 
print(str(i)) 



[.'instruction with 

La solution la plus propre pour ecrire dans un fichier consiste a utiliser un bloc 
try. . f i nal 1 y pour s'assurer que la methode cl ose est appelee quoi qu'il advienne. 

Ecriture dans un fichier 



>» f = open ('fichier' , 'w') 
>» try: 

... f .write('contenu') 

... f i nal 1 y : 

f.closeQ 



Appeler close , c'est s'assurer que le handler de fichier est bien libere. 

Ce motif est recurrent en programmation : utiliser une ressource dans un bloc de 
code et terminer par un appel a du code specifique pour fermer proprement Faeces a 
cette ressource quoi qu'il advienne dans le bloc. Le meme besoin existe pour la mani- 
pulation de semaphores, ou de sockets reseau. 
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L'instruction with permet de s'afFranchir de la gestion du bloc try. .finally et de 
l'appel au code de fermeture, en s'en chargeant automatiquement du moment que 
l'objet manipule est compatible avec ce protocole, appele le context management protocol. 

C'est le cas pour les objets de type file. Lecriture ci-dessous est equivalente a un 
bloc try . . f i nal 1 y avec un appel a cl ose. 

Ecriture dans un fichier avec with 

>» f = open('fichier' , 'w') 

>» with f: 

... f .write('contenu') 

with se base sur deux nouvelles methodes speciales enter et exit . La pre- 
miere est appelee au debut du bloc, la deuxieme a la fin. 

Exemple de classe supportant with 

>» class SupportWith(object) : 
def enter (self): 

print('debut') 
def exit (self, exc_type, exc_value, traceback): 

print ('fin ') 

>» s = SupportWithO 
>» with s: 

print('bloc') 

debut 

bloc 

fin 

La methode enter ne prend aucun parametre, alors que la methode exi t en 

demande trois. Ces derniers permettent de recuperer une eventuelle exception : 

• exc_type : le type de l'erreur declenchee ; 

• exc_val ue : la valeur de l'erreur declenchee ; 

• traceback : l'objet traceback. 

Si aucune erreur n'a lieu, toutes ces valeurs sont a None. 

exit ne doit jamais declencher d'erreur ou redeclencher l'erreur qui lui est 

passee. La methode retourne cependant False lorsqu'elle souhaite que l'erreur con- 
tinue a etre propagee. Si elle retourne True, l'erreur est absorbee et l'interpreteur con- 
tinue le programme en se positionnant sur la directive suivante apres le bloc. 
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Declenchement d'une erreur 



>» class CatchTypeError(object) : 

def enter (self): 

print('debut') 

def exit (self, exc_type, exc_value, traceback): 

print('fin') 

if exc_type == TypeError: 

return True 
return False 

>» c = CatchTypeError() 
>» with c: 

raise TypeErrorO 

debut 

fin 

>» with c: 

... raise AttributeErrorO 

debut 

fin 

Traceback (most recent call last): 

File "<stdin>", line 2, in <module> 
AttributeError 



Enfin, si une erreur survient dans la methode exit , elle prevaudra sur toute 

erreur precedente. 

Lorsque l'objet utilise est initialise directement, une directive as peut etre associee a wi th 
Ecriture dans un fichier 



>» with open('fichier' , 'w') as f: 
... f .write('contenu') 

Dans ce cas, f se voit attribuer la valeur renvoyee par enter . L'usage le plus cou- 

rant est done de renvoyer sel f dans cette methode. 
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Utilisation de as 

>» class SomeContext(object) : 
def enter (self): 

print ('debut') 

return self 
def exit (self, *args) : 

print('fin ') 

with SomeContextO as s: 
print(str(s)) 
print('bloc') 

debut 

< main .SomeContext object at 0xc00730> 

bloc 
fin 



La bibliotheque standard fournit en outre un module contextlib, decrit dans le 
chapitre 10, qui detaille les utilitaires pour Implementation de ce protocole. 



En un mot... 



Python possede une syntaxe claire, concise et simple, et est dote de types standards 
tres puissants. 

Le chapitre suivant couvre des elements de syntaxe complementaires, pour la struc- 
turation des programmes. 



5 



Structuration du code 



Pour organiser un programme, il est possible de regrouper les sequences constructions 
en fonctions et classes. Ces regroupements peuvent ensuite etre organises en plusieurs 
fichiers, appeles modules, et dans plusieurs repertoires pour former un paquet. 

Ce chapitre presente chacune de ces structures, pour conclure sur des elements sup- 
plementaires de syntaxe bases sur les classes : la gestion des exceptions, les generators 
et les iterators. 



Fonctions 



Les fonctions sont les elements structurants de base de tout langage procedural. 
Cette section explique comment definir des fonctions en Python et presente plus 
precisement : 

• le contexte d'execution et la directive gl obal ; 

• la directive return ; 

• le fonctionnement des parametres ; 

• la directive 1 ambda ; 

• les decorators pour les fonctions. 

Ecrivons une premiere fonction qui affiche a l'ecran un texte d'accueil en fonction 
d'un nom. 
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Une premiere fonction 

>» def home (name) : 

... print(' Bonjour %s ' % name) 

>» homeCBill ') 
Bonjour Bill 

La definition d'une fonction se fait par le biais du mot-cle def suivi du nom de la 
fonction. Suivent des parentheses qui contiennent les eventuels parametres de la 
fonction puis le caractere : qui delimite le debut d'une sequence de code. 

Une fonction peut done etre vue comme un bloc de lignes associe a un nom. Cette fonc- 
tion devient alors accessible dans le contexte d'execution par le biais de son nom comme 
toute variable. Le code de la fonction definit son propre contexte local d'execution. 

Contexte d'execution et directive global 

Lorsque des variables sont definies dans le code, elles sont placees par l'interpreteur 
dans un des deux dictionnaires representant le contexte d'execution : 

• Le premier dictionnaire contient l'ensemble des variables globales et est accessible 
par le biais de la primitive gl obal s () . 

• Le second, accessible par la directive local s(), contient l'ensemble des variables 
accessibles a un instant donne et est dependant du contexte. 

Lorsqu'elle est invoquee, une variable est recherchee dans le contexte local puis 

global, et en dernier recours dans les elements definis dans le module builtins 

(ce module fait l'objet d'un chapitre complet dedie a la presentation des primitives). 

Lors de sa definition, une variable est inseree : 

• Dans le contexte local si elle est definie dans un bloc (boucle, fonction...). 

• Dans le contexte global si elle est definie en dehors de tout bloc. 

Ainsi, il est impossible d'affecter directement les variables du contexte global depuis 
un bloc. 

Contexte d'execution 

>» name = 'Joe' 
>» def home(name): 

print(localsO) 
... print('Bonjour %s' % name) 
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>» home('Tarek') 
{ 'name' : 'Tarek' } 
Bonjour Tarek 
>» print(globalsO) 

{' buil tins ': <module ' builtin ' (bui"lt-in)>, ' name ': 

' main ', 'home': <function home at 0xb7def fOo , ' doc ': None, 

'name' : ' Joe' } 

Pour pouvoir contoumer cette limitation il est necessaire d'utiliser la directive global 
qui permet de specifier que la variable est dans le contexte global. 

Utilisation de la directive global 

>» identity = 'Joe Bie' 

>» def home(fi rstname, lastname): 

global identity 

identite = '%s %s' %(fi rstname, lastname) 

print(localsO) 

print (identity) 

>» home(' Joe' , 'Bae') 

{ 'fi rstname' : 'Joe', 'lastname': 'Bae'} 

Joe Bae 

>» print(identity) 

Joe Bae 



Directive return 



II n'y a pas de distinction entre les fonctions et les procedures en Python, contraire- 
ment a certains langages fortement types comme Ada. Les procedures sont tout sim- 
plement des fonctions qui ne renvoient pas de resultat comme en C. Plus precise- 
ment, une fonction qui ne renvoie pas explicitement de valeur renvoie un objet None. 

Lorsqu'une fonction doit renvoyer un resultat explicite, la directive return est utilisee. 
Utilisation de return 

>» def double(number) : 
return number-2 

>» double(5) 

10 

>» def sequence(start , stop, step): 

... return range(start, stop, step) 

>» sequence(2, 7, 1) 

[2, 3, 4, 5, 6] 
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II est possible de retourner plusieurs resultats en les separant par des virgules. Dans 
ce cas, l'interpreteur renvoie ces elements dans un tuple. 

Plusieurs resultats 

>» def three_nums() : 
return 1,2, 3 

>» three_nums() 
(1, 2, 3) 



Culture L'ecriture pythonique 

Renvoyer les elements separes par des virgules est tres specifique au langage et est souvent prefere a 
('utilisation d'une structure regroupante. Cette ecriture est souvent employee lorsqu'une fonction doit 
renvoyer deux ou trois resultats. On parle ici d'ecriture pythonique. 



Parametres d'une fonction 

II existe trois types de parametres : 

• les parametres explicites et valeurs par defaut ; 

• les parametres non explicites ; 

• les parametres arbitraires. 

Parametres explicites et valeurs par defaut 

Les parametres explicites sont les parametres utilises dans les exemples precedents, a 
savoir des noms separes par des virgules. Chacun de ces parametres peut en outre etre 
enrichi d'une valeur par defaut et devenir optionnel. 

Valeur par defaut 



>» def home(fi rstname, T.astname='Doe') : 

... print('%s %s' % (fi rstname, Jastname)) 

>» home(' John') 

John Doe 

>» home ('John' , 'Dull ') 

John Dull 

II est cependant necessaire de regrouper tous les parametres optionnels a la fin de la 
liste des parametres. 
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Lorsqu'il y a plusieurs parametres optionnels, le code appelant peut definir ou non la 
valeur de chacun sans avoir a respecter un ordre precis, en utilisant la notation 
nom=valeur pour ce parametre. On parle alors de nommage des parametres. 

Nommage des parametres 

>» def sum(a, b=2 , c=3) : 
return a + b + c 

>» sum(2) 

7 

>» sum(2, 3, 4) 

9 

>» sum(2, c=4) 

8 

>» sum(a=2, b=3 , c=4) 

9 



A RETENIR Les parametre nommes 

Tous les parametres peuvent etres nommes. Cette notation permet aussi de fournir les valeurs dans un 
ordre quelconque. 
>» def sub(a, b) : 
return a - b 

>» sub(10, 5) 

5 

>» sub(b=10, a=5) 

-5 

>» sub(a=10, b=5) 

5 
Lorsqu'une fonction possede beaucoup de parametres, il est judicieux de nommer systematiquement 
tous les parametres, afin de rendre le code plus lisible. 



Enfin, les valeurs par defaut ne sont interpretees qu'une seule fois, au moment de la 
lecture de la definition, ce qui peut etre relativement important si ces valeurs sont 
retournees par des objets modifiables. Chaque nouvel appel a la fonction appellera les 
memes objets qui ont ete evalues a l'initialisation de la fonction. 

Lecture par I'interpreteur des valeurs par defaut 

>» def param() : 
... print(' param() appele') 
return [1, 2 , 3] 
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>» def add_element (element , ~list_=param()) : 
... "I ist_. append (element) 
return list 

param() appele 
>» add_element(4) 
[1, 2, 3, 4] 
>» add_element(5) 
[1, 2, 3, 4, 5] 
>» def param() : 
... print(' param() appele') 
return [5] 

>» add_element(8) 
[1, 2, 3, 4, 5, 8] 

Les parametres non explicites 

Python propose un systeme de parametres non explicites qui permet de laisser l'appe- 
lant fournir autant de valeurs nominees qu'il le souhaite sans qu'il soit necessaire de 
les definir dans la liste des arguments. Ces parametres sont fournis sous la forme 
nom=valeur a la fonction. L'interpreteur place ces valeurs dans un dictionnaire qu'il 
faut au prealable definir en fin de liste par son nom precede de deux etoiles : 

Utilisation de parametres non explicites 

>» def sentence(-*words) : 

print ('Recu %d mot(s)' % len(words)) 
... print ('Liste des mots: %s ' % ' ' . join(words. values())) 
... print ('Nom des parametres: %s' % ' ' . join(words .keys())) 

>» sentence(motl='mot 1', mot2='mot2') 

Recu 2 mot(s) 

Liste des mots: mot 1 mot2 

Nom des parametres: motl mot2 

>» sentence(encore="des mots", toujours="des mots") 

Regu 2 mot(s) 

Liste des mots: des mots des mots 

Nom des parametres: encore toujours 

>» sentenceO 

Recu mot(s) 

Liste des mots: 

Nom des parametres: 

Cette ecriture offre un maximum de souplesse puisqu'elle peut etre combinee avec les 
parametres explicites. 
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Combinaison de parametres explicites et non explicites 

» def team(name, leader='non defini', **players): 
print(' Equipe %s ' % name 
print ('Capitaine: %s' % leader) 
for name, value in pi ayers.i terns : 
print('%s: %s' % (name, value)) 

>» team('Les bleus') 

Equipe Les bleus 

Capitaine: non defini 

>» team('Les vai 11 ants', 'Robert', gardien= 'Andre' 

attaquant= ' Mi chel i ne ' ) 
Equipe Les vai 11 ants 
Capitaine: Robert 
attaquant: Micheline 
gardien: Andre 



ASTUCE Utiliser un dictionnaire 

Le dictionnaire pi ayers peut aussi etre directement fourni. 
L'ecriture : 

team('Nom', 'Capitaine', gardien='Andre' , attaquant=' Micheline') 
etant equivalente a : 

players = {gardien: 'Andre', attaquant: 'Micheline'} 

team('Nom', 'Capitaine', '■•■•players) 



Les parametres arbitraires 

Les parametres arbitraires sont equivalents aux parametres non explicites sauf qu'ils 
ne sont pas nommes. Linterpreteur les regroupe dans un tuple nomme qu'il passe a 
la fonction. Le nom du tuple est fourni prefrxe cette fois-ci d'une seule etoile. 

Parametres arbitraires 

>» def format(sentence, *args) : 
print(sentence % args) 

>» format('%d fois plus de %s possibles', 2, 'combinaisons ') 
2 fois plus de combinaisons possibles 

Lorsque des parametres arbitraires sont combines avec des parametres explicites ou 
non explicites, la declaration du nom du tuple qui contiendra les valeurs se place tou- 
jours apres les parametres explicites et avant les parametres non explicites. 
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ASTUCE Utiliser la notation arbitraire 

II est possible d'utiliser la notation arbitraire dans des fonctions a parametrage classique en fournissant 
une sequence comme valeur. La sequence sera decompressee en une liste de parametres. 
>» def sum(a, b, c) : 
return a + b + c 

>» elements = [1, 3, 5] 

>» sum(*elements) 

9 



Ainsi, une fonction sera toujours sous la forme indiquee ci-dessous. 
Forme d'une fonction 
def nom_fonction(a, b, c, ..., ''-'arbitral res, **exp"li cites) 

Collisions de parametres 

Une fonction peut done utiliser trois types de parametrages et les combiner. II faut 
cependant prendre garde aux collisions possibles : un parametre doit rester unique 
dans l'ensemble des parametres fournis. En cas de doublons, une exception 
TypeError est retournee. 

Collisions de noms 

>» def display(a, **kw) : 
print ('a: %s' % a) 
... for name, value in kw. i terns (): 

print('%s: %s ' % (name, value)) 

>» display (12, a=2 , b=3, c=4) 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
TypeError: displayO got multiple values for keyword argument 'a' 

Signatures multiples de fonctions 

La signature d'une fonction est representee par la liste de ses parametres. Certains 
langages proposent des systemes de surcharge pour permettre au developpeur de 
definir plusieurs fois la meme fonction avec des signatures differentes. C'est le role de 
la directive overload en Delphi par exemple. 

Les combinaisons infinies de parametrage de fonction offertes par Python repondent 
beaucoup plus simplement a ce probleme de signature multiple. 
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Directive lambda 



Issue de langages fonctionnels comme le Lisp, la directive 1 ambda permet de definir 
une fonction anonyme, c'est-a-dire sans nom. 1 ambda est utilisee lorsqu'une fonction 
est a fournir dans une expression et permet d'eviter de la definir explicitement. Cette 
fonction doit cependant se limiter a une seule expression. 

Raccourci lambda 

>» # fonction explicite 

>» elements = [1, 2, 3] 
>» def add_one(e): 
return e + 1 

>» map(add_one, elements) 

[2, 3, 4] 

>» # equivalent avec lambda 

>» map(lambda e: e + 1, elements) 
[2, 3, 4] 



Mis a part quelques cas precis comme l'exemple presente, lambda est a proscrire car 
cette directive rend le code difficilement lisible. 

Documentation strings (docstrings) 

Les objets docstrings sont des chaines de caracteres placees au debut du corps des 

fonctions. lis sont automatiquement associes a la variable doc de l'objet fonction 

par l'interpreteur. 

Une fonction dotee d'un docstring 



>» def pi () : 

... """Renvoie une approximation du nombre Pi.' 
return 3 .14 

>» print(pi. doc ) 

Renvoie une approximation du nombre Pi. 

ou bien : 

>» help(pi) 

Help on function pi in module main : 

pi() 

Renvoie une approximation du nombre Pi. 
(END) 
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Toutes les fonctions fournies dans Python sont dotees d'un docstring, ce qui est pra- 
tique pour une documentation en ligne directe. On y renseigne sur l'objectif de la 
fonction et sur le detail de ses parametres. 

Details sur divmod par son docstring 

>» print (divmod. doc ) 

divmod (x, y) -> (div, mod) 

Return the tuple ((x-x%y)/y, x%y) . Invariant: div*y + mod == x. 



A RETENIR Importance des docstrings 

Les docstrings jouent un role relativement important en Python. Le chapitre 7 decrit precisement les con- 
ventions de nommage des docstrings et le chapitre 12 leur utilisation dans le cadre des tests unitaires. 



Decorators 



Les decorators sont issus d'un besoin de generalisation des mecanismes introduits par 
les fonctions cl assmethod () et stati cmethod () apparus a la version 2.2 de Python. 

En l'occurrence, pour specifier qu'une fonction est une methode statique ou une methode 
de classe (voir les decorators pour les classes a la prochaine section), il est necessaire de 
proceder a un appel a l'une des primitives en passant en parametre la fonction. 

D'un point de vue plus general aux fonctions, le principe, caique sur le modele exis- 
tant en Java (annotations), est d'effectuer un pretraitement au moment de 1' appel 
d'une fonction. 

Definition d'un pretraitement 

>» def decorate(function) : 

... function. doc = 'Fonction decoree %s ' % function. doc 

... return fonction 

>» def a_function() : 

"""Ma fonction. """ 
... print(' traitement ') 

>» a_f unction = decorate(a_f unction) 

>» print(a_function . doc ) 

Fonction decoree Ma fonction. 

La fonction decorate decore la fonction a_f unction de details supplementaires et la 
liaison se fait par function=decorate(function) . 
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Pour simplifier l'ecriture, les decorators introduisent un nouveau mecanisme qui 
permet de specifier qu'une fonction est encapsulee dans une deuxieme fonction. 

II suffit de prefixer la definition de la fonction a encapsuler par le nom de la 
deuxieme fonction prefrxe d'une arobase (@). 

Definition d'un decorator 

>» def decorate(function) : 

... function. doc = 'Fonction decoree %s' % function. doc 

return function 

>» ©decorate 

... def a_function() : 

"""Ma fonction. """ 
... print(' traitement ') 

>» print a function. doc 

Fonction decoree ma fonction 

Plusieurs decorators peuvent etres utilises sur la meme fonction : ils sont imbriques 
dans l'ordre de declaration. 

EnchaTnement de decorators 

@fl @f2 @f3 
def a_function() : 
pass 

Cette notation etant equivalente a l'ecriture ci-dessous : 
Equivalent explicite 
function = fl(f2(f3(function))) 

Les decorators servent egalement a la mise en place de code patterns recurrents, 
comme le controle de types de parametres entrants, d'enrichissement du contexte 
d'execution ou de tout mecanisme pre ou post-execution. La fonction decoratrice est 
declaree une bonne fois pour toute et reutilisee en decorator. 

Controle d'argument 

>» def only_ints(func) : 

... def _only_ints(arg) : 

... ifnot isinstance(arg, int): 

... raise TypeError(" '%s' doit etre un entier" % str(arg)) 
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return func(arg) 
... return _only_ints 

>» @only_ints 
... def function(arg) : 
return arg + 1 

>» print(function(' t')) 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "<stdin>", line 4, in only_ints 
TypeError: 't' doit etre un entier 
>» print(function(3)) 
4 

Une fonction de decoration ne doit pas a proprement parler executer de code au 
moment de son appel, car cet appel est provoque par l'interpreteur lorsqu'il lit la defi- 
nition de la fonction decoree. II demande alors a la fonction de decoration de lui ren- 
voyer une fonction qui sera appelee a chaque execution de la fonction decoree. 

Quelques pri nt permettent de mieux comprendre cette mecanique : 

La mecanique des decorators 

>» def only_ints(func) : 

... print('appel du decorator') 

... def _only_ints(arg) : 

... print('appel du code de decoration') 

... ifnot isinstance(arg, int): 

... raise TypeError(" '%s' doit etre un entier" % str(arg)) 

... print('capsule execute la fonction') 

return func(arg) 

... print('only_ints renvoi la capsule') 

... return only ints 

>» @only_ints 
... def function(arg) : 
return arg + 1 

appel du decorator 

argument^entier renvoi e la capsule 

>» function(5) 

appel du code de decoration 

capsule execute la fonction 

6 
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La sous-fonction _only_i nts() permet done de retourner le code a executer lorsque 
la fonction sera reellement appelee. only_ints() ici prend en parametre la fonction a 
decorer et retourne la fonction a appeler. 

II est possible de passer des arguments aux decorators : l'appel devient de la forme 
@fonction(parametres). Dans ce cas, la fonction utilisee doit renvoyer une fonction 
au format decorator classique, afin de permettre a l'interpreteur d'effectuer un appel a 
decorateur (fonction). 

L'enchainement est le suivant : l'interpreteur appelle dans un premier temps la fonc- 
tion de decoration, d'une maniere tout a fait classique (resultat 
decorator(parametres)), puis utilise son resultat pour un appel a la fonction 
decoree, soit resultat (fonction). 

Decorator parametre 

>» def only_int(function) : 
def _only_int(arg) : 

ifnot isinstance(arg, int): 

raise TypeError(" '%s' doit etre un int" % str(arg)) 
return function(arg) 
return _only_int 

def only_long(function) : 
def _only_long(arg) : 

ifnot isinstance(arg, long): 

raise TypeError(" '%s' doit etre un long" % str(arg)) 
return function(arg) 
return only long 

def int_or_long(force_long) : 
if force_long: 

return only long 
else: 

return only_int 

@i nt_or_l ong (True) 

def function(arg) : 

return arg + 1 

>» function(45) 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "<stdin>", line 4, in only_long 
TypeError: '45' doit etre un long 
>» function(459876455L) 
459876456L 
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Si on ajoute des pri nt pour mettre en valeur l'enchainement : 
EnchaTnement d'un decorator parametre 

>» def on! y_int (function) : 

. . .printC'appel de only_int') 

... def _only_int(arg) : 

... ifnot isinstance(arg, int): 

... raise TypeError(" '%s' doit etre un int" % str(arg)) 

return function(arg) 
... print(' renvoi de _only_int') 

... return only int 

>» def only_long(function) : 

... print(' renvoi de only_long') 

... def _only_long(arg) : 

... ifnot isinstance(arg, long): 

... raise TypeError(" '%s' doit etre un long" % str(arg)) 

return function(arg) 
... print(' renvoi de only long') 

return only long 

>» def int_or_long(force_long) : 

... printC'appel de int_or_long') 

... if force_long: 

... print(' renvoi de only_long') 

return only_long 
... el se : 

... printC renvoi de only_int') 

return only_int 

>» @int_or_long(True) 
... def function(entier) : 
return entier + 1 

appel de int_or_long 
renvoi de only_long 
appel de only_long 
renvoi de _only_long 
>» function(56L) 
57L 



Avenir Emergence des decorators 

Les patterns d'utilisation des decorators emergent actuellement des travaux des developpeurs de la com- 
munaute. II est possible qu'a terme Python propose une liste etendue de decorators. 
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Classes 



Sans etre familier avec la programmation orientee objet (POO), on peut considerer 
que les classes sont similaires a des modules : des regroupements logiques de fonc- 
tions et de variables pour definir un comportement et un etat du programme. Cette 
logique se retrouve dans les elements manipules en Python, puisque tout est objet. 
Ainsi, un objet de type string regroupe des fonctions de manipulation sur la chaine 
comme replaceO et des variables comme doc . 

La difference fondamentale entre un module et une classe se situe dans l'utilisation 
de cette derniere : elle definit un modele d'objet que Ton peut ensuite instancier 
autant de fois que necessaire. Une instance devient un objet independant qui con- 
tient les fonctions et les variables definies dans le modele. 



Aller PLUS LOIN La programmation orientee objet 

Si vous n'etes pas familier avec les concepts de la POO, le chapitre 14 est une bonne introduction a son 
utilisation en Python. 



Definition 



Le mot reserve class sert a definir un modele en associant un certain nombre de 
variables et de fonctions a un nom. 

La classe Voiture 

>» class Car: 

color = 'Rouge' 



Toutes les variables et les fonctions placees dans le niveau d'indentation de la classe en 
deviennent des membres. Ces elements sont nommes attributs et on parle plus precise- 
ment de methodes pour les fonctions et d' attributs de donnees pour les variables. 

La classe Car definie dans l'exemple peut ensuite etre utilisee pour instancier des 
objets en 1' appelant comme une fonction. 

Instanciation 

>» car_l = Car() 
>» car_2 = Car() 

Ces deux objets de type Car sont des instances distinctes. 
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Espace de noms 

Pour atteindre la variable color de l'instance car_l, il faut specifier quelle se trouve 
dans car_l pour la distinguer par exemple, d'une eventuelle variable portant le meme 
nom definie en dehors de la classe. Cette differenciation se fait par le biais de l'espace 
de noms, ou namespace, que l'interpreteur cree lorsque l'instance de classe est utilisee. 

Cet espace de noms peut etre vu comme un dictionnaire propre a cette instance de 
classe. II porte les correspondances entre noms d'attributs et valeurs de ces attributs. 
Ainsi, la notation car_l . col or est utilisee par l'interpreteur pour atteindre l'attribut 
color de l'instance car_l. 

Pour rechercher color dans car_l, le mapping precede dans cet ordre : 

• Recherche si car_l. diet ['color'] existe. 

• Recherche si type(car_l). diet ['color'] existe (equivalent a 

Car. diet ['color']). 

Si l'attribut en question n'existe pas et s'il est utilise dans le cadre d'une attribution de 
valeur, le mecanisme de mapping ajoute aussitot l'objet fourni dans la liste des attri- 
buts de l'instance liste conservee dans le mapping di ct . Les autres instances ne 

profitent pas de ce nouvel attribut, sauf s'il est attribue a la classe meme. 

Mapping d'attributs 

>» class Car: 

color = 'Rouge' 

>» red_car = Car() 

>» blue_car = Car() 

>» red_car.color 

'Rouge' 

>» blue_car. color 

'Rouge' 

>» blue_car. color = 'Bleu' 

>» red_car.color 

'Rouge' 

>» blue_car. color 

'Bleu' 

>» red_car.ai r_conditioner = 'oui' 

>» red_car.ai r_conditioner 

'oui' 

>» blue_car.ai r_conditioner 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
AttributeError: Car instance has no attribute 'ai r_conditioner' 
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Parametre self 



De la meme maniere que pour une fonction, l'interpreteur met a jour les variables 
locales et globales lors de l'execution des methodes. Le code execute a done une visi- 
bilite locale aux elements definis dans la methode et globale aux elements en dehors 
de l'instance. 

Pour atteindre les elements definis dans l'espace de noms de l'instance de la classe, il 
est done necessaire d'avoir un lien qui permette de s'y referer. L'interpreteur repond a 
ce besoin en fournissant l'objet instancie en premier parametre de toutes les 
methodes de la classe. 

Par convention, et meme si ce nom n'est pas un mot-cle du langage, ce premier para- 
metre prend toujours le nom self. 

Utilisation de self 

>» class Car: 

color = 'Red' 
state = 'arret' 
def start(self) : 

self. state = 'marche' 
def stop(self) : 

self. state = 'arret' 

>» car = Car() 

>» car. state 

'arret' 

>» car.startO 

>» car. state 

'marche' 

Les methodes definies dans les classes ont done toujours un premier parametre 
fourni de maniere transparente par l'interpreteur, car.startO etant remplace au 
moment de l'execution par Car. start (car). 

On comprend par cette notation que le code defini dans la classe Car est partage par 
toute les instances et que seuls les attributs de donnees instancies dans les methodes 
restent specifiques aux instances. 



Heritage 



Le plus grand interet des classes est bien sur l'heritage. Lheritage est la faculte d'une 
classe B de s'approprier les fonctionnalites d'une classe A. On dit que B herite de A 
ou encore que B derive de A. 
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Python permet de definir des classes derivees tees simplement : 

Classe derivee 

>» class Mehari (Car) : 
pass 

Au moment de l'instanciation de la classe Mehari, l'interpreteur memorise le nom de 
la classe parente afin de l'utiliser lorsque des attributs de donnees ou des methodes 
sont utilises : si l'attribut en question n'est pas trouve dans la classe, l'interpreteur le 
recherche dans la classe parente. Si 1'attribut n'est pas trouve dans la classe parente, 
l'interpreteur remonte l'arbre de derivation a la recherche d'une methode portant la 
meme signature avant de provoquer une exception Attn' buteError. 

Heritage des attributs 

>» class Car: 

type = 'Venture' 
... def print_type(self) : 
... print(self .type) 

>» class Mehari (Car) : 
pass 

>» class MehariTurbo(Mehari) : 
pass 

>» car = MehariTurboO 
>» car.print_type() 
Venture 



Heritage multiple 

Python supporte l'heritage multiple en laissant la possibilite de lister plusieurs classes 
parentes dans la definition. 

Heritage multiple 

>» class Television: 

brand = ' ' 
... def print_brand(self) : 
... print(self .brand) 

>» class DVDPlayer: 
... def play_dvd(self) : 
pass 
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>» class TVDVDCombo (Television, DVDPlayer): 
pass 

>» ch'r (TVDVDCombo) 

[' doc ', ' module ', 'brand', 'play_dvd', 'print_brand'] 

La mecanique de recherche des attributs est appliquee a chacune des classes de base, 
de gauche a droite. Dans notre cas, lorsqu'un attribut est demande a l'instance de 
classe TVDVDCombo, l'interpreteur parcourt l'arbre de derivation de la classe 
Tel evi si on comme dans le cas d'un heritage simple, puis passe a la classe DVDP1 ayer 
si 1'attribut ha pas ete trouve. 

Lorsque des classes parentes ont une classe de base commune, il devient difficile de 
maitriser les enchainements d'appels et d'avoir une bonne visibilite. L'utilisation de 
l'heritage multiple est done delicate et fortement deconseillee dans la plupart des cas. 
Son utilisation peut parfois etre imposee lorsqu'un framework un peu rigide est utilise. 

Surcharge des attributs 

Toutes les methodes et attributs de donnees peuvent etre surcharges, en utilisant la 
meme signature. 

Surcharge 

>» class Car: 

type = 'Voiture' 
... def print_type(self) : 
... print(self . type) 

def use_type(self) : 
... self . print_type() 

>» class Mehari (Car) : 
... def use_type(self) : 

print('Mehari et %s' % self. type) 

>» my_car = Mehari () 

>» my_car.print_type() 

Voiture 

>» my_car.use_type() 

Mehari et Voiture 

L'interpreteur utilise alors la premiere methode qu'il trouve en suivant la regie de 
recherche precedemment enoncee. Le mecanisme introduit par le mapping de nom, 
qui fournit aux methodes l'instance par le biais du parametre sel f , permet au code 
des methodes de manipuler d'autres attributs. 
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Si une methode doit specifiquement utiliser un attribut que la regie de surcharge ne 
lui renvoie pas, il est possible de preciser a l'interpreteur de quelle classe il s'agit, en 
utilisant un prefixe de la forme : ClasseDeBase.methode(self , parametres). 

Polymorphisme 



>» class Mehari (Car) : 

def print_type(self) : 

printC'Mehari et %s' % self. type) 
def use_type(self) : 

Car.print_type(self) 

>» my_car = Mehari () 
>» my_car.pr"int_type() 
Car 



Constructeur et destructeur 

Lorsqu'une classe est instanciee, la methode speciale init () est invoquee avec 

en premier parametre l'objet nouvellement instancie par l'interpreteur. 

Ce fonctionnement permet de proceder a un certain nombre d'initialisations lorsque 
Ton cree une instance de classe. 

Initialisation de I'instance 

>» class Car: 

def init (self): 

... print("Nouvelle voiture n°%s" % id(self)) 

self .immatriculation = '%s XZ 21' % id(self) 

>» my_car = Car() 
Nouvelle voiture n°211949876 
>» my_car .immatriculation 
'211949876 XZ 21' 

Grace aux proprietes d'attributions fournies par le mapping, il est d'usage de declarer 
les attributs de donnees directement dans le constructeur lorsque ceux-ci ne sont pas 
partages par toutes les instances : ils sont attaches a l'objet au moment de leur initia- 
lisation comme c'est le cas dans notre exemple pour i mmatri cul ati on 

Comme pour une methode classique, le constructeur peut recevoir des parametres 
supplementaires, qui sont directement passes au moment de l'instanciation. 
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Constructeur parametre 

>» class Car: 

... def init (self, type): 

self .type = type 

>» my_car = Car("Mehari Supa'Turbo") 
>» my_car.type 
"Mehari Supa'Turbo" 

Un destructeur peut egalement etre defini grace a la methode speciale del () 

lorsque du code doit etre appele au moment de la destruction de l'instance. Cette 
methode est appelee par le garbage collector. Le code contenu dans cette methode doit 
explicitement appeler la methode del () des classes parentes, si elles existent. 

Destructeur 

>» class A: 

def _del_(self): 
... print('destructeur') 

>» a = A() 
>» del a 

destructeur 



AVERTISSEMENT Utilisation de del 

L'utilisation de del est a proscrire car elle peut provoquer des erreurs au moment ou le code est 

appele. 

Par exemple, I'ordre de destruction des objets au moment de I'arret d'un programme n'est pas garanti, et 

le destructeur peut appeler des references a des objets qui n'existent plus. 



Attributs prives 



En ce qui concerne la protection des attributs, il est possible de definir des attributs 
prives a la classe en prefixant le nom de deux espaces soulignes. Si l'attribut se ter- 
mine aussi par des espaces soulignes, ils ne doivent pas etre plus de deux pour qu'il 
reste considere comme prive. 

L'interpreteur repere ces attributs et modifie leurs noms dans le contexte d'execution. 
Pour un attribut a de la classe Class, le nom devient _Class a. 

Le mapping etend alors la recherche a cette notation lorsque les appels se font depuis 
le code de la classe, de maniere a ce que les appelants exterieurs n'aient plus d'acces a 
l'attribut par son nom direct. 
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Protection d'attributs 

>» class Car: 

defaults = ['bruyante'] 

qualities = ['rapide', 'economique'] 
def caracteristics(self) : 

print (self. defauts) 

print (self .qualites) 
def visibility (self) : 

print(di r(self)) 

>» o = Car() 

>» o.caracteristicsO 

['bruyante'] 

['rapide', 'economique'] 

>» o. qualities 

['rapide', 'economique'] 

>» o. defaults 

Traceback (most recent call last): 
File "<stdin>", line 1, in ? 

AttributeError: Voiture instance has no attribute ' defaut' 

>» o. visibilityO 

['_Car defaults', ' doc ', ' module ', ' caracteristiques' , 

'qualites', ' visibilite'] 

>» o._Car defaults 

['bruyante'] 

Contrairement a d'autres langages objets, cette protection reste declarative et nest 
pas absolue : il est tout a fait possible d'acceder a un attribut prive en faisant appel a 
son nom prefixe, meme si cela n'a aucun interet. 



A RETENIR Nom des attributs prives 

Le nom des attributs prives est tronque a 255 caracteres par I'interpreteur 



Appelee name mangling, cette mecanique permet d'eviter les collisions de noms dans 
des cas precis au niveau du code de I'interpreteur lui-meme. Cependant son utilisa- 
tion est a proscrire dans les programmes simples, car il n'y a pas reellement d'interet 
de marquer ainsi ses attributs dans un langage qui prone les conventions sur les noms 
des elements au lieu de forcer certains mecanismes. Quoi qu'il en soit, lorsque des 
attributs doivent etre marques comme prives, la meilleure pratique est de les prefixer 
par un seul espace souligne. 



Futur Retrait du name mangling ? 

Le retrait pur et simple du name mangling a ete propose dans le passe, les prochaines versions de 
Python ne I'auront peut-etre plus. 
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Marquage simple d'attributs 

>» class Car: 

... _defaults = ['bruyante'] 

qualities = ['rapide', 'economique' ] 



Methodes speciales 

II est possible en Python de definir d'autres methodes speciales que init () et 

del (), qui determinent un fonctionnement specifique pour une classe lorsqu'elle 

est utilisee dans certaines operations. 

Ces methodes permettent de faire varier le comportement des objets et sont regrou- 
pees en fonction des cas d'utilisation : 

• representation et comparaison de l'objet ; 

• utilisation de l'objet comme fonction ; 

• acces aux attributs de l'objet ; 

• utilisation de l'objet comme conteneur ; 

• utilisation de l'objet comme type numerique. 

Representation et comparaison de l'objet 

_str_0 

Appelee par la primitive str(). Doit renvoyer une representation sous forme de 
chaine de caracteres d'un objet. Cette representation peut etre un transtypage de 
l'objet en objet stri ng lorsque c'est possible ou une representation plus informelle. 

Str() 

» class A: 

def str (self): 

... return 'je suis un objet de type A' 

>» a = A() 

>» str (a) 

'je suis un objet de type A' 

_repr_() 

Appelee par la primitive repr(). Similaire a str () sauf que la representation 

doit etre une expression Python telle que eval (repr(a)) == a lorsque c'est possible. 



Elements du langage 

Deuxieme partie 

repr () doit done permettre de recreer l'objet. Si le reverse n'est pas possible, 

repr () doit renvoyer une string de la forme '<description>'. Les instances de 

classe renvoient en general leur adresse memoire. 

emp (other) 

Utilisee par tous les operateurs de comparaison lorsque l'objet est implique. 
emp () doit renvoyer : 

• un entier negatif si sel f est inferieur a other ; 

• un entier positif si sel f est superieur a other ; 

• zero en cas d'egalite. 

[_lt_, _le_, _eq_, _ne_, _gt_, _ge_](othcr) 

Ensemble de methodes de comparaison, qui sont utilisees de preference a emp () 

si elles sont presentes, pour chacun des operateurs. Ces methodes doivent renvoyer 
True ou False ; 

• a < b correspond a a . It (b) ; 

• a <= b correspond a a . le (b) 

• a == b correspond a a . eq (b) 

• a != b correspond a a . ne (b) 

• a > b correspond a a . gt (b) ; 

• a >= b correspond a a . ge (b). 

II n'y a aucun controle d'integrite sur ces operateurs : ne et eq peuvent tous 

les deux renvoyer True. Lorsqu'une methode est implemented, il est done conseille 
de toujours implementer la methode symetrique pour assurer l'integrite. 

Enfin, si ni emp () ,ni eq et ne ne sont definies, la primitive id() sera 

utilisee pour la comparaison. 

_hash_0 

Appelee par la primitive hash() ou par un objet dictionnaire lorsque l'objet est utilise 
comme cle. Doit renvoyer un entier de 32 bits. Si deux objets sont definis comme 

egaux, par emp (), eq () ou ne (), hash () doit renvoyer la meme 

valeur pour ces deux objets. 

nonzero () 

Appelee par la primitive bool () et par la comparaison avec True ou Fal se. Doit ren- 
voyer True ou Fal se. Lorsque cette methode n'est pas definie, e'est 1 en () qui est 

utilisee. len () represents la taille de l'objet. Si aucune des deux methodes n'est 

presente, l'objet est toujours considere comme vrai. 
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Unicode 

Appelee par la primitive unicodeO. Doit renvoyer un objet de type Unicode. Si la 
methode n'est pas implementee, une conversion en string est tentee, puis un pas- 
sage de string a Unicode. 

Utilisation de I'objet comme fonction 

Lorsqu'une instance d'objet est appelee comme une fonction, c'est call () qui 

est appelee si elle est definie. Les objets de cette classe deviennent, au meme titre 
qu'une fonction ou une methode, des objets callable. 

Class callable 

>» class A: 

... def call (self, one, two): 

return one + two 

>» a = A() 

>» callable(a) 

True 

>» a(l, 6) 

7 

Acces aux attributs de I'objet 

Lorsque l'interpreteur rencontre une ecriture de type objet. attri but, il utilise le 

dictionnaire interne diet pour rechercher cet attribut, et remonte dans les dic- 

tionnaires des classes derivees si necessaire. 

L'utilisation des trois methodes suivantes permet d'infiuer sur ce fonctionnement. 

_setattr_() 

setattr () est utilisee lorsqu'une valeur est assignee, en lieu et place d'une modi- 
fication classique de l'attribut di ct de I'objet. 

objet. attribut = 'valeur' devient equivalent a objet. setattr ('attribut', 

'valeur') 

Le code contenu dans setattr () ne doit pas appeler directement l'attribut a 

mettre a jour, au risque de s' appeler lui-meme recursivement. II faut utiliser un acces 
a diet . 

getattr () et getattribute 

getattr () est appelee en dernier recours lorsqu'un attribut est recherche dans un 

objet. Cette methode ne surcharge pas le fonctionnement normal afin de permettre a 
setattr (), lorsqu'elle est surcharged, d'acceder aux attributs normalement. 
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Les new-style class, presentees dans la prochaine section, introduisent cependant une 

nouvelle methode getattn'bute (), qui comme setattr () permet de sur- 

charger completement l'acces aux attributs. 

_delattr_0 

Complement des deux methodes precedentes, objet. delattr ('attribut') est 

equivalent a del objet. attribut. 

Essais sur les attributs de mapping 

>» class Person: 

def getattr (self, name): 

print('getattr %s' % name) 

if name in self. diet : 

return self. diet [name] 

else: 

print("attribut '%s' inexistant" % name) 

def setattr (self, name, valeur): 

print('set %s : %s' % (name, str(valeur))) 

self. diet [name] = valeur 

def delattr (self, name): 

print('del %s' % name) 

if name in self. diet : 

del self. diet [name] 

else: 

print("attribut '%s' inexistant" % name) 

>» John = Person() 

>» John. age = 20 

set age: 20 

>» john.fi rst_name 

getattr f i rst_name 

attribut 'first_name' inexistant 

>» john.fi rst_name = 'John' 

set first_name: John 

>» del john.fi rst_name 

del f i rst_name 

>» john.fi rst_name 

getattr f i rst_name 

attribut 'first_name' inexistant 

Utilisation de I'objet comme conteneur 

Les mappings et les sequences sont tous des objets de type conteneurs, qui imple- 
mentent un tronc commun de methodes. Ces methodes sont presentees ci-dessous et 
peuvent etre definies dans toute classe. 



Structuration du code 

Chapitre 5 

getitem (key) 

Utilisee lorsqu'une evaluation de type objet[key] est effectuee. Pour les objets de 
type sequences, key doit etre un entier positif ou un objet de type slice. Les map- 
pings, quant a eux, utilisent des cles de tout type non modifiable. 

Si la cle fournie n'est pas d'un type compatible, une erreur TypeError est retournee. 
Enfin, si la cle est en dehors des valeurs autorisees, une erreur de type IndexError est 
retournee. 

setitem (key, value) 

Utilisee lorsqu'une assignation de type objet [key] = valeur est effectuee. Les 

memes erreurs peuvent etre utilisees que celles de getitem . Les mappings ajou- 

tent automatiquement la cle lorsqu'elle n'existe pas, contrairement aux sequences qui 
retournent une erreur si la cle n'existe pas. 

delitem (key) 

Permet de supprimer une entree du conteneur. 

_len_0 

Appelee par la primitive len(), et permet de renvoyer le nombre d'elements du con- 
teneur. 

_iter_() 

Appelee par la primitive iter(), et doit renvoyer un iterator capable de parcourir les 
elements. 

contains (item) 

Renvoie vrai si i tern se trouve parmi les elements. 

Un peu de contenu 

>» class MyContainer: 

def init (self): 

self._data = {} 

def getitem (self, key): 

if key in self._data: 

return self ._data[key] 
else: 

print("Je n'ai pas %s" % key) 

def setitem (self, key, value): 

self ._data[key] = value 

def delitem (self, key): 

print('on ne fait pas ca chez moi') 
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def _len_(self): 

return len(self ._data) 
def contains (self, item): 

return item in self ._data. valuesQ 



>» inside = MyContainerO 

>» inside ['12'] 

Je n'ai pas 12 

>» inside['la_cle'] = 45 

>» inside['la_cle'] 

45 

>» len(inside) 

1 

>» del inside['la_cle' ] 

on ne fait pas ca chez moi 

>» inside['la_cle2' ] = 34 

>» len(inside) 

2 



Utilisation de I'objet comme type numerique 

Ces methodes peuvent etre utilisees pour definir le fonctionnement de I'objet 
lorsqu'il est employe dans toute operation numerique, que ce soit une addition, un 
decalage de bits vers la gauche, ou encore une inversion. Chacune de ces methodes 
renvoie en general I'objet lui-meme, qui est l'operande de gauche, pour assurer une 
logique au niveau des operateurs, mais peut dans certains cas renvoyer l'operande de 
droite ou un tout autre objet. 

Tableau 5-1 Methodes pour les operateurs numeriques 



Methode 


Operation 


Variations 


add (other) 


objet + other 


Retl 


sub (other) 


Objet - other 


Retl 


mul (other) 


objet * other 


Retl 


floordiv (other) 


objet // other 


Retl 


mod (other) 


objet % other 


Retl 


divmod (other) 


divmod (objet, other) 


Retl 


pow (other[, modulo]) 


objet ** other 


Retl 


1 shift (other) 


objet « other 


Retl 


rshift (other) 


objet » other 


Retl 


and (other) 


objet & other 


Retl 


xor (other) 


objet a other 


Retl 


or (other) 


objet | other 


Retl 


div (other) 


objet / other 


Retl 
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Tableau 5-1 Methodes pour les operateurs numeriques (suite) 



Methode 


Operation 


Variations 


truediv (other) 


objet / other 


Retl 


neg O 


- objet 




pos () 


+ objet 




_abs_() 


abs (objet) 




"invert () 


~ objet 




complex () 


complex(objet) 




_int_() 


int (objet) 




long () 


long(objet) 




_float__() 


float(objet) 




_oct_() 


oct(objet) 




_hex_() 


hex(objet) 




coerce (other) 


coerce(objet, other) 





Pour toutes ces methodes, un appel a objet operateur other declenche un appel a 
obj et . methode (other) . 

La variation I ajoute un prefixe i a la methode ( "iadd (), imul (), etc.) et 

permet de definir les operateurs augmentes +=, *=, etc. Cette variation renvoie en 
general objet augmente de other. 

La variation R ajoute un prefixe r a la methode ( radd (), rmul (), etc.) et 

permet de definir des operateurs inverses : other, operateur (object) est appele en 
lieu et place de objet. operateur (other). Lorsque l'operation classique n'est pas 
supportee, l'interpreteur tente l'operation inverse. 

Surcharge de I'addition 

>» class Additionable: 

def init (self, value): 

self. value = value 
def add (self, other): 

return Additionable(self. value + other. value ) 
def iadd (self, other): 

return self. add (other) 

def str (self) : 

return str(self. value) 

>» vail = Additionable(5) 
>» va!2 = Additionable (12) 
>» val 3 = vail + val2 
>» str(val3) 
'17' 
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>» val 3 += val 1 

>» str(va!3) 

'22' 

>» str(vall) 

'5' 

>» str(va!2) 

'12' 



New-style classes 



Python 2.2 a introduit un nouveau type d'objet appele object. Ce type definit une 
classe qui peut etre utilisee comme classe de base pour toute nouvelle definition de 
classe. Les classes basees sur le type object sont appelees new-style class. 

New-style class 

>» object. doc 

'The most base type' 
>» class Car: 
pass 

>» class NewCar(object) : 
pass 

>» mehari = Car() 
>» citroen_c5 = NewCarO 
>» di r(mehari) 
['_doc_', '_module_'] 
>» di r(citroen_c5) 

[' class ', ' delattr ', ' diet ', ' doc ', ' format ', 

' getattribute ', ' hash ', ' init ', ' module ', ' new ', 

' reduce ' , ' reduce_ex ' , ' repr ' , ' setattr ' , ' str ' , 



subclasshook 



_weakref '] 



object introduit un certain nombre de methodes privees qui permettent de benefi- 
cier de nouveaux mecanismes comme : 

• un nouveau Method Resolution Order ; 

• le constructeur statique, sorte de meta-constructeur pour toutes les instances d'un 
type de classe ; 

• la surcharge de type() par les metaclass, qui permet de controler le cycle complet 
de creation d'un objet ; 

• les descriptors, qui permettent de personnaliser l'acces aux attributs ; 

• les properties, descriptors automatiques ; 

• les slots, economiseurs de memoire. 
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Le nouveau Method Resolution Order 

La mecanique de recherche des attributs s'appelle le Method Resolution Order 
(MRO) et utilise un algorithme qui parcourt l'arborescence des classes en profondeur 
puis de gauche a droite. 

Cette mecanique change avec l'introduction d'object comme type de base commun 
aux types fournis dans Python. En effet, l'ancien algorithme ne pouvait plus 
repondre a tous les cas d'heritages multiples introduits par l'insertion de object dans 
l'heritage de certains types. Ainsi, l'heritage en « diamant » provoquait avec 1' algo- 
rithme precedent un fonctionnement illogique. 

Utilisation de mro 

>» class Television (object) : 
brand = ' ' 

def print_brand(self) : 
print (self. brand) 

>» class TelevisionSatellite(Television) : 
channels = [] 
def list_channels(self) : 
return self, channels 

>» class DVDPlayer(object) : 
def play_dvd(self) : 
pass 

>» class DVDWriter(DVDPlayer) : 
def write_dvd(self) : 
pass 

>» class SuperTVDVDCombo(TelevisionSatellite, DVDWriter): 
pass 

>» di r(SuperTVDVDCombo) 

[' class ', ' delattr ', ' diet ', ' doc ', ' format ', 

' getattribute ', ' hash ', ' init ', ' module ', ' new ', 

' reduce ', ' reduce_ex ', ' repr ', ' setattr ', ' sizeof ', 

' str ', ' subclasshook ', ' weakref ', 'brand', 'channels', 

'list_channels' , 'play_dvd', 'print_brand' , 'write_dvd'] 

>» SuperTVDVDCombo. mro 

(<class ' main .SuperTVDVDCombo'>, <class 

' main .TelevisionSatellite'>, <class ' main .Television^, <class 

1 main .DVDWriter '>, <class ' main .DVDPlayer'>, <type 'object'>) 
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Constructeur statique 

Lorsqu'une classe derivee d'object est instanciee, la methode speciale new () est 

appelee par l'interpreteur si elle est implementee. 

new () est une methode statique de la classe, qui prend en premier parametre le 

type de la classe ainsi que 1'ensemble des parametres de construction. Cette methode 
doit renvoyer une nouvelle instance de la classe, qui devient sel f . 

i ni t () est appelee juste apres new () avec en premier parametre sel f puis la 

liste des parametres de construction fournis. 

Ce fonctionnement permet de proceder a un certain nombre d'initialisations supple- 
mentaires au niveau de la classe, que ce soit des manipulations d'attributs statiques ou 
des modifications de l'objet nouvellement cree. 

Implementer new () consiste en general a appeler la methode new () de la 

classe de base, par le biais de la primitive super(), et a proceder a des initialisations 
en amont ou en aval de cet appel. 

Initialisation de I'instance par new () et init () 

>» class Car(object): 
production = 
def new (els): 

print("une nouvelle Voiture va sortir de l'usine") 

self = super(Car, els). new (els) 

els. product! on += 1 

return self 
def init (self) : 

print("nouvelle voiture n°%s" % id(self)) 

self .immatriculation = '%s XZ 21' % id (self) 

>» car = Car() 

une nouvelle Voiture va sortir de l'usine 

nouvelle voiture n°211950068 

>» car .production 

1 

>» car. immatriculation 

'211950068 XZ 21' 



AVANCE Utilisation de _new_() 

Le chapitre 13 sur la programmation orientee objet couvre des cas pratiques d'utilisation de 
new () . 
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Surcharge de typeO par metaclass 

Les classes en Python sont creees par le biais de la primitive type(), par un appel a 
type(nom de la classe, nom des classes de base, mapping des attributs). II 
est possible avec les new-style class de surcharger ce mecanisme et de proposer sa 
propre fonction de creation : la metaclass. 

Cette fonction finit toujours par appeler type() mais ce point d'acces supplemental 
sur la chaine de construction rend les controles beaucoup plus puissants qu'avec les 
constructeurs statiques puisqu'il devient possible d'intervenir au moment de la crea- 
tion de la classe, mere de toutes les instances. 

Une metaclass se met en place en defmissant une variable metaclass pointant 

sur un objet callable. Cette variable peut se trouver dans la classe, et est utilisee a 
chaque fois qu'une instance de cette classe, ou de l'une des classes derivees, est creee. 
Si elle nest pas definie dans la classe, et si la classe ne possede pas d'attribut 
class , l'interpreteur regarde si une variable globale metaclass existe. 

Metaclass a I'oeuvre 

>» def cls(cls, bases, diet): 

... printC'classe "%s" en place' % els) 

... return type(cls, bases, diet) 

>» metaclass = els 

>» class Classl: 
pass 

classe "Classl" en place 
>» class Class2 : 
pass 

classe "Class2" en place 
>» class Class3(object) : 
... metaclass = els 

classe "Class3" en place 

Cette puissance autorise la mise en place d'une quantite infinie de mecanismes, 
comme l'ajout d'attributs a la classe, l'implementation de statistiques, etc. 

L'interet de ce mecanisme par rapport a la derivation est de donner la possibilite 
d'introspecter dynamiquement l'interface d'une classe au moment de sa creation. 



Danger Les metaclass ne doivent pas etre des pansements a une mauvaise architecture 

Le danger des metaclass est d'implementer des fonctionnalites en cachant I'architecture et le fonctionne- 
ment des classes. Elles rendent aussi la comprehension du programme difficile. 
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Descriptors 

Lorsqu'un attribut a est recherche dans un objet A par l'interpreteur que ce soit pour une 

lecture, une affectation, ou une suppression, il invoque tour a tour A. diet ['a'], 

puis type (A) . diet ['a'], et ainsi de suite jusqu'a la classe debase. 

Les descriptors permettent de surcharger ce mecanisme en fournissant a l'interpre- 
teur des methodes get () , set () et del ete () . 

Une seconde new-style class doit etre specifiquement creee pour 1' attribut et doit 
definir ces methodes. Cette classe devient une sorte d'encapsulation et permet de 
gerer toutes les demandes d'acces a 1' attribut. 

Descriptor 

>» class Immatriculation(object) : 

... def get (self, instance, classe): 

... if instance isnot None and hasattr(instance, '_immat'): 
... return instance. _immat 

... el se : 

return ' ' 

... def set (self, instance, valeur): 

... instance. _immat = valeur 

... def delete (self, instance): 

... print('Suppression interdite !') 

>» class Car(object): 

... immatriculation = Immatriculation() 

>» electric_car = Car() 

>» el ectric_car. immatriculation 

>» el ectric_car .immatriculation = 'V 

>» el ectric_car .immatriculation 

'V 

>» di r(electric_car) 

[' class ', ' delattr ', ' diet ', ' doc ', ' getattribute ', 

' hash ', ' init ', ' module ', ' new ', ' reduce ', 

' reduce_ex ' , ' repr ' , ' setattr ' , ' str ' , ' weakref ' , 

'_immat', 'immatriculation'] 

>» del el ectric_car .immatriculation 

Suppression interdite ! 

>» el ectric_car .immatriculation 

'V 

>» Car .immatriculation 
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La classe descriptor doit gerer les demandes faites par toutes les instances de la 
classe utilisatrice : 

• get (instance, classe) : est appelee avec en parametre l'instance courante 

et la classe. Si l'appel est effectue sur la classe directement, instance est a None. 

• set (instance, value) : permet d'affecter une valeur sur l'instance. 

• del ete (i nstance) : supprime l'attribut de l'instance. 

Properties 

L'ecriture des descriptors peut etre relativement lourde lorsque l'objectif est d'encap- 
suler de la maniere la plus basique une variable d'instance. 

La primitive propertyO fournit cette generalisation et evite d'avoir a creer une 
deuxieme classe en charge de la gestion de l'attribut : elle associe directement a une 
variable donnee trois methodes d'acces. 

property(fget=None, fset=None, fdel=None, doc=None) -> property attribute 

fget, fset et fdel correspondent a trois objets callable (fonctions, methodes ou 
classes avec methode call ()). 

doc permet d'associer a la volee a la propriete un docstring, puisqu'il n'est pas pos- 
sible de le faire par code. 

Implementation de property 

>» class Car(object): 

def init (self): 

self ._immat = ' ' 
def _setimmat (self, value): 

self._immat = value 
def _getimmat(self) : 

return self._immat 
def _delimmat(self) : 

print('achete un meilleur tournevis') 
immatriculation = property(_getimmat , _setimmat, _delimmat) 

>» car = Car() 

>» car. immatriculation 

>» car. immatriculation = '3245 XX 21' 

>» car. immatriculation 

'3245 XX 21' 

>» del car. immatriculation 

achete un meilleur tournevis 

>» voitu re. immatriculation 

'3245 XX 21' 
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On retrouve ainsi un modele beaucoup plus leger que les descriptors et tres proche 
syntaxiquement d'autres langages qui implementent les proprietes, comme Delphi. 

Slots 

A chaque creation d'objet, l'interpreteur associe a l'instance un dictionnaire di ct 

charge de contenir ses attributs. Les slots introduisent un mecanisme global a la 

classe, qui permet d'eviter la creation d'un di ct par instance pour economiser de 

l'espace memoire : le mapping modifie sa facon d'acceder aux attributs, en se referant 
aux slots. 

Ce gain devient interessant lorsqu'une meme classe est instanciee une multitude de 
fois dans un programme. 

Les slots sont definis dans une variable statique slots , sous la forme d'une 

sequence ou d'un iterable. Si une seule variable est a reserver, slots peut etre un 

objet de type string. 

Utilisation des slots 

>» class Car(object): 

... slots = ['color', 'immatriculation' , 'horsepower'] 

>» car = Car() 

>» car. color = 'Rouge' 

>» car .immatriculation = '1111 XR 21' 

>» car .horsepower = 7 

>» dir(car) 

[' class ', ' delattr ', ' doc ', ' getattribute ', ' hash ', 

' init ', ' module ', ' new ', ' reduce ', ' reduce_ex ', 

' repr ', ' setattr ', ' slots ', ' str ', 'color', 

'immatriculation', 'horsepower'] 

>» hasattr(car, ' diet ') 

False 

>» car. col or 

'Rouge' 

Lutilisation des slots entraine cependant quelques restrictions : 

• Limplementation des slots, basee sur les descriptors, empeche lutilisation d'attri- 
buts de classe pour initialiser les valeurs des attributs definis dans les slots : ils 
ecraseraient les definitions de descriptors. 

• Si une classe de base definit le meme nom de slot que la classe derivee, la variable 
de la classe de base ne peut plus etre atteinte. II est done necessaire de controler 
qu'un slot ne surcharge pas un autre slot, en attendant qu'une prochaine version 
de Python ajoute un controle pour empecher ce probleme. 
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• Une classe ne beneficie pas des slots de la classe dont elk derive. 

• Les instances ne peuvent plus se voir attribuer de nouveaux attributs 
dynamiquement : une erreur AttributeError est retournee. Depuis la version 

2.3, il est possible d'ajouter le nom di ct aux slots pour autoriser l'ajout dyna- 

mique d'attributs. 

• Les instances ne peuvent plus beneficier du mecanisme des weak references. 
Cette situation peut etre debloquee en ajoutant comme precedemment le nom 
weakref aux slots. 

Decorators pour les classes 

Les decorators directement utilisables en Python sont des fonctions declarees dans 
les built-ins. C'estle cas de staticmethod et classmethod, presentees dans le chapitre 
suivant. 



Modules 



Passes les essais dans le prompt Python, il est necessaire de sauvegarder le code dans 
des fichiers, appeles modules. Un module est un objet charge par l'interpreteur a 
partir d'un fichier texte qui contient un regroupement de variables, classes et fonc- 
tions. Le fichier est en en general d'extension . py 

Module absmod3.py 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

module absmod3 

def only_int(func) : 

"""Decorator pour verifier les parametres. """ 
def _only_int(arg) : 

ifnot isinstance(arg, int): 

raise TypeError(" '%s' doit etre un entier" % str(arg)) 
return func(arg) 
return _only_int 

@only_int 

def absmod3(a) : 

"""Renvoie 'abs(a) mod 3' pour a entier.""" 

return abs(a) % 3 
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Directive import 

La directive import permet ensuite d'utiliser le code contenu dans le fichier python. 
Sa syntaxe est : 

import modulel[, module2, ...]. 

Importation du module absmod3 

>» import absmocB 
>» di r(absmod3) 

[' builtins ', ' doc ', ' file ', ' name ', 'absmod3', 

'only_int'] 

>» absmod3. file 

'absmod3.py' 

>» absmod3.absmod3(-44) 

2 

import absmod3 cherche dans le repertoire courant le fichier absmod3.py, puis dans 
la liste des repertoires definis dans la variable d'environnement PYTHON PATH et enfin 
dans le repertoire d'installation de Python qui contient tous les modules fournis avec 
l'interpreteur. Cette liste de repertoires peut etre retrouvee dans la liste path du 
module sys, et meme modifiee a la volee. 

Extension de sys.path 



>» import sys 
>» sys.path 
[", '/usr/lib/python24 
python2 . 4/pl at-1 i nux2 ' , 
python2 . 4/1 i b-dynl oad ' , 
python2 . 4/si te-packages 
PIL', '/usr/lib/python2 
si te-packages/wx-2 .5.3 
>» import absmod3 
Traceback (most recent 
File "<stdin>", line 
ImportError: No module 



>» 
>» 
>» 


>» 

[" 



sys .path. append ('/h 
import absmod3 
absmod3.absmod3(6) 



.zip', '/usr/lib/python2.4' , '/usr/lib/ 
'/usr/lib/python2.4/lib-tk' , '/usr/lib/ 
' /usr/lib/python2. 4/si te-packages ' , '/usr/lib/ 

/Numeric' , '/usr/lib/python2 .4/si te-packages/ 
4/site-packages/gtk-2 .0' , '/usr/lib/python2 .4/ 

gtk2-ansi '] 

call last): 
1, in ? 
named absmod3 
ome/tzi ade/Desktop ' ) 



sys .path 
' /usr/1 i b/python24 
python2 . 4/pl at-1 i nux2 ' , 
python2 . 4/1 i b-dynl oad ' , 
python2 . 4/si te-packages 
PIL', '/usr/lib/python2 
si te-packages/wx-2 .5.3 



.zip', '/usr/lib/python2.4' , '/usr/lib/ 
'/usr/lib/python2.4/lib-tk' , '/usr/lib/ 
' /usr/1 ib/python2. 4/si te-packages ' , '/usr/lib/ 

/Numeric' , '/usr/lib/python2 .4/si te-packages/ 
4/site-packages/gtk-2 .0' , '/usr/lib/python2 .4/ 

gtk2-ansi ' , '/home/tzi ade/Desktop'] 
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L'importation genere un objet de type module qui contient, outre l'ensemble des ele- 
ments du fichier, deux variables globales name et f i 1 e qui contiennent res- 

pectivement le nom du module et le nom du fichier systeme correspondant. 

Variables globales name et file 

>» absmocB. name 

'absmocB' 

>» absmocB. file 

' /home/tzi ade/Desktop/absmod3 . pyc ' 

On constate que le nom du fichier n'est pas absmocB. py mais absmocB. pyc. Les 
fichiers .pyc sont issus d'une optimisation automatiquement mise en oeuvre par 
l'interpreteur : lorsque qu'un module est invoque, il recherche dans le repertoire du 
fichier source un fichier portant le meme nom avec l'extension . pyc. Le contenu de 
ce fichier correspond au resultat du travail de lecture du fichier source par l'interpre- 
teur (analyse lexicale) et permet de gagner du temps au moment du chargement. 

Ce gain de temps peut etre relativement important lorsque des sources importent 
plusieurs modules qui eux-memes en importent d'autres et ainsi de suite : l'arbre des 
dependances peut etre rapidement consequent et la quantite de code a lire pour pre- 
parer les contextes d'execution monstrueuse. 

Ce fichier est bien sur recalcule par l'interpreteur si sa date de creation est anterieure 
a la date de modification du fichier source. 



Primitive reload 



Lorsqu'un fichier source est modifie et deja charge par une directive import, les 
modifications ne seront pas visibles par le code. Un deuxieme appel a import ne 
rechargera pas non plus le fichier car avant d'importer un module, l'interpreteur 
verifie qu'il ne Test pas deja, en scrutant sys.path. La primitive reload permet de 
forcer le rechargement du fichier. 

Rechargement d'un module 

>» reload (absmod3) 

<module 'absmod3' from ' /home/tzi ade/Desktop/absmod3. pyc '> 

Attention cependant : les eventuelles instances de classe deja creees ne sont pas tou- 
chees par l'appel a rel oad. 
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Directives from et as 

En general, seules quelques fonctionnalites d'un module ont besoin d'etre importees 
dans un autre module. La directive from permet d'importer dans le contexte d'execu- 
tion un element specifique du module et s'ecrit : 

I from module import elementl[, element2, ...] 

Importation de la fonction absmod3 

>» from absmod3 import absmod3 
>» absmod3(4) 

1 

Cette ecriture est d'autant plus interessante qu'elle permet d'affiner les dependances 
entres modules et de ne plus avoir a prefixer les elements du nom du module 
importe. Pour eviter d'eventuelles collisions de noms, il est en outre possible de 
modifier le nom importe par le biais de la directive as. 

Alias 

>» from absmod3 import absmod3 as transformation 
>» transformation^) 

1 

Lorsque plusieurs elements d'un meme module doivent etre importes, il est possible 
de le faire dans la meme directive import, en separant chaque element par une vir- 
gule. 

Plusieurs elements d'un meme module 

I >» from absmod3 import absmod3, absmod3, absmod6 

Lorsque la ligne d'importation depasse 80 caracteres et qu'un retour a la ligne est 
souhaitable, il est possible depuis la version 2.4 d'utiliser des parentheses pour 
regrouper les elements a importer. 

Passage a la ligne 

>» # < Python 2 .4 

>» from absmod3 import absmod3,\ 

absmod3, \ 
absmod6 
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>» # >= Python 2.4 

>» from absmod3 import (absmocB, 

absmocB, 
absmod6) 

II existe aussi un raccourci pour importer tous les elements d'un module, le joker. 
Tous les elements d'un meme module 
>» from absmod3 import * 

Lorsqu'un module definit par exemple une serie de constantes, rutilisation du joker 
pour avoir acces a ces constantes dans le code est tres pratique. Certains toolkits gra- 
phiques, comme Tkinter ou wx, sont organises de telle maniere que l'utilisation d'un 
joker est conseillee. En dehors de ces cas particuliers, cette notation est a proscrire 
car elle reduit considerablement la visibilite des dependances entres modules. 



Paquets 



Un deuxieme niveau d'organisation permet de structurer le code : les fichiers Python 
peuvent etre organises dans une arborescence de repertoires que Ton appelle paquet. 
Chaque repertoire peut etre utilise dans une directive d'importation au meme titre 
qu'un fichier. 

Le caractere . joue alors le role de separateur, pour localiser un module dans une 
arborescence de repertoire. 

Organisation d'un paquet 

Prenons l'exemple d'une application de gestion de fichiers clients. Le programme 
possede un noyau autour duquel sont organises une interface graphique, un moteur 
de base de donnees, et un module metier qui permet d'appliquer des calculs statisti- 
ques sur les clients. On peut representer cette organisation sous la forme de 
repertoires : 

FichierClient 

init .py 

description.py 
noyau 

| init .py 

| application.py 
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interface 

1 "init .py 

| fiche_c"lient.py 
| liste_clients.py 
bdd 

| init .py 

| acces_bd.py 
| acces_pgsql .py 
stats 

| init .py 

| frequence. py 



Chaque repertoire faisant partie du paquet doit posseder un fichier init .py 

pour que l'interpreteur le prenne en compte. Ce fichier peut etre vide ou contenir du 
code d'initialisation qui est execute des que le repertoire est trouve dans une directive 
d'importation. II represente le repertoire dans le contexte d'execution. 

Exemples d'utilisation du paquet : 

• from FichierClient import description : charge les modules init et 

description du repertoire FichierClient. 

• from FichierClient .noyau import application : charge les modules init 

des repertoires Fi chi erCl i ent et noyau , et le module appl i cati on. 

• Dans le module frequence, py : l'importation relative from ..bdd import 
acces_db permet d'atteindre le module acces_db. 



Import * et all_ 



Lorsqu'un paquet est mis en place, l'interpreteur parcourt automatiquement les 

repertoires contenant un fichier init .py a la recherche de fichiers Python. Le 

resultat de cette recherche peut varier d'un systeme a 1' autre. Sur un systeme 
MS-Windows ou Macintosh, les noms de fichiers recuperes peuvent avoir une casse 
qui varie et un fichier python dont le nom contient des majuscules ne sera pas force- 
ment importe de la meme maniere. 

Pour eviter ce probleme, lorsqu'un appel a from Paquet import * est fait, l'interpre- 
teur n'importe que les elements trouves dans le fichier i ni t . py du repertoire. La 

seule possibility pour importer tous les modules du repertoire est de les definir explici- 
tement dans une variable globale al 1 dans le fichier i ni t . py du repertoire. 

Ainsi le fichier i ni t . py du repertoire interface contiendra : 



_all = ['fiche_client' , 'liste_clients '] 
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References relatives 

Dans un paquet, chaque module peut se referer a d'autres modules. Lorsque ces 
modules sont dans le meme repertoire, il est bien sur possible d'utiliser une notation 
relative sans avoir a prefrxer le module des noms des paquets. Si ces modules sont dans 
un repertoire voisin, il est necessaire d'ecrire le chemin absolu pour chacun d'entre eux. 

Importations dans le module fiche client 

import Fi chi erCli ents. noyau. application 
import Fi chi erG i ents . descri pti on 
import liste clients 



Depuis Python 2.5, il est possible de realiser des imports relatifs a la localisation du 
module en cours, en utilisant la notation . pour designer le repertoire courant. Par 
exemple, si un deuxieme module uti 1 s . py, place dans le meme repertoire que le 
module absmod3 . py, les deux ecritures suivantes sont equivalentes. 

Importation relative 

from absmod3 import absmod3 

from . import absmod3.absmod3 as absmod3 

Cette ecriture n'a d'interet que pour recuperer des references dans des modules situes 
dans une arborescence de repertoires. 

Dans l'exemple du paquet Fi chi erCli ents, le module fiche_c"lient.py peut 
atteindre le module acces_bd. py ainsi : from ..bdd import acces_bd. 

De maniere similaire au fonctionnement des chemins dans les interpreters de com- 
mande MS-Windows ou *nix, chaque point de la directive from permet de remonter 
dans le repertoire parent du repertoire en cours. 



Exceptions 



Lorsqu'un evenement ou des conditions d'execution ne sont pas souhaitables, il est 
possible de lever une exception. L'interpreteur passe alors dans un mode particulier 
ou il stoppe 1' execution du programme en cours et affiche une erreur. C'est le cas par 
exemple lorsque Ton tente une division par zero. 
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Division par zero 

>» 7 / 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
ZeroDivisionError: integer division or modulo by zero 

Le message affiche contient en general le traceback, c'est-a-dire la pile d'appel, le 
type d'exception levee et enfin un message explicite sur le probleme rencontre. La 
pile d'appel est le chemin parcouru par l'interpreteur pour atteindre l'erreur, soit la 
liste des methodes et fonctions traversers pour atteindre l'erreur. 

Pour lever une exception, il suffit d'utiliser la directive rai se suivie d'une classe ou 
d'une instance de classe. 

Utilisation d'une classe d'exception 

>» class BrokenCode: 
pass 

>» def func() : 

raise BrokenCodeO 

>» func() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 2, in func 
main .BrokenCode: < main .BrokenCode instance at 0x84300> 



BON a SAVOIR Exceptions de type string 

Le support des exceptions de type string (comme raise 'erreur ! ') a ete supprime depuis 
Python 2.6. 



Meme si tout type de classe peut servir dans une exception, il est recommande d'uti- 
liser ou de specialiser les classes d'exceptions fournies dans Python et presentees dans 
la prochaine section. 



Exceptions du langage 

Python propose une liste de classes d'exception directement accessibles sans directive 
d'importation, et utilisees par le langage. Les classes sont organisees en deux 
niveaux : 

• La premiere couche contient un ensemble de classes de base qui ne sont jamais 
directement appelees. 
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• La deuxieme couche represente soit des classes qui derivent d'une des classes de 
base et qui sont utilisables, soit des classes concretes. 



A RETENIR Difference entre classes d'exception abstraites et concretes 

Cette distinction entre classes d'exception abstraites et concretes est purement symbolique et il reste 
techniquement tout a fait possible de lever des exceptions avec les classes de base. 



Classes (('exceptions de base 

Exception 

Exception est la classe de base de toutes les exceptions. Son constructeur peut etre 
appele avec un ou plusieurs parametres libres qui sont conserves dans l'attribut args. 
Lorsque 1' exception est levee, l'interpreteur affiche le type d'exception, suivi de la 
chaine de caracteres obtenue par str (exception), soit un appel a 

exception. str (). La methode str () de la classe Exception renvoie une 

chaine de caracteres representant args. 

StandardError 

Derivee d'Exception, StandardError est la classe de base pour la quasi-totalite des 
classes d'exceptions. 

ArithmeticError 

Derivee de StandardError, ArithmeticError est la classe debase pour les exceptions 
relatives aux erreurs arithmetiques, soit la division par zero (ZeroDi vi sionError), un 
depassement de capacite (OverflowError), une erreur de calcul en virgule flottante 
(Floating Point Error). 

LookupError 

Derivee de StandardError, LookupError est la classe de base pour les exceptions 
relatives aux erreurs d'index ou de cle, lorsqu'un appel a une cle inexistante est faite 
sur un mapping ou sur un index hors limite sur une sequence. 

EnvironmentError 

Derivee de StandardError, EnvironmentError est la classe de base pour les erreurs 
systeme, comme des erreurs de lecture ou d'ecriture (lOError) ou des erreurs provo- 
quees lors d'appels a des API systeme (OSError). 

Le systeme d'exploitation possede une liste d'erreurs standardisee, representee par 
des entiers que Ton peut retrouver dans le module errno. Lorsqu'un programme 
provoque une erreur systeme, il peut lever une exception EnvironmentError cons- 
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truite avec le couple (errno, message). L'instance presentera alors deux attributs 
errno et strerror, utilises par str (). 

Levee d'une OSError 

>» import errno 

>» error = OSError(errno. ECONNREFUSED, 'Connection refused') 

>» raise error 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
OSError: [Errno 111] Connection refused 

II est possible enfin d'instancier 1' exception avec un troisieme parametre representant 
un nom de fichier. Ce troisieme parametre est souvent utile pour IOError. 

UnicodeError 

Classe de base pour les erreurs relatives aux conversions entre type Unicode et type 
string et aux problemes de traduction de caracteres (par appel de translate()). 
Une erreur de conversion d'unicode vers string est une erreur d'encodage 
(UnicodeEncodeError) et de string vers Unicode une erreur de decodage 
(Uni codeDecodeError). Cette distinction a ete introduite dans la version 2.3. 

Warning 

Classe de base pour toutes les exceptions de type avertissement. 

Classes concretes 

Les classes d'exceptions concretes sont presentees dans le chapitre suivant. 

try.. except.. else 

Lorsqu'une exception est levee, le programme est interrompu et l'interpreteur 
remonte en sens inverse toutes les couches de code precedemment traversees, a la 
maniere d'une bulle d'air qui remonte dans l'eau. Arrivee a la surface, l'exception est 
affichee et le programme s'arrete. 

II est cependant possible de stopper cette remontee en interceptant 1' erreur, avec la 
directive try. .except. Toutle code contenu ou appele dans le bloc delimite par try 
est surveille par l'interpreteur. En cas de levee d'exception, l'execution du bloc s'arrete 
et l'interpreteur execute le code contenu dans le bloc except avant de continuer le 
programme normalement. 

Si le code ne leve pas d'exception le programme continue et ignore le bloc contenu 
dans except. 
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II reste en outre possible d'appeler a nouveau une directive ran se dans le bloc except 
(principe du reraise). 

Utilisation de try.. except 

>» try: 

print(2 / 0) 
. . . except : 

... print('une erreur est survenue') 

une erreur est survenue 

Cette ecriture a cependant un inconvenient majeur : il est impossible de savoir quel type 
d'erreur est survenue dans le bloc. Cette protection aveugle peut entrainer des effets de 
bords dans la suite du programme en masquant silencieusement toutes les erreurs. 

Pour eviter ce probleme, il est possible de preciser quelle classe d'exception est geree 
par la directive except. Dans ce cas, le bloc sera ignore si l'exception levee n'est pas 
du type indique. 

Typage de l'exception 

>» try: 

print(2 / 0) 
except ZeroDivisionError: 
print C+infini ') 

+infini 

En outre, il est possible d'associer plusieurs exceptions a un bloc except et 
d'enchainer plusieurs blocs except. 

Serie d'except 

>» try: 

print(a) 
except ZeroDivisionError: 

print('division par zero') 
except (AttributeError, NameError): 

print('eiement non defini') 

element non defini 

except peut aussi prendre un nom de variable en deuxieme parametre qui recoit 
l'instance de l'exception levee. 
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>» try: 

print(2 / 0) 
... except ZeroDivisionError, error: 
... print(' Erreur: %s ' % str(error)) 

Erreur: integer division or modulo by zero 

Enfin, un bloc else peut etre ajoute a la fin du bloc try. .except, et ne sera execute 
que s'il n'y a eu aucune erreur. 



try., finally 



La directive try.. finally permet de s' assurer qu'un bloc de code est toujours 
execute : le bloc contenu dans la directive try peut lever une exception, ou meme 
executer une directive return ou break, le bloc finally sera toujours execute. 

Lecture d'un fichier 



>» with open('zipfile. py' , 'w') as file_ 
try: 

some_code() 
finally: 

fil e_.wri te('fini ') 



Dans cet exemple, la directive finally permet de s'assurer que le mot « fini » sera 
ecrit dans le fichier, quoi qu'il advienne dans some_code(). 



A RETENIR Debogage d'un programme Python 

Pour deboguer un programme Python, il convient d'utiliser le module pdb, presente au chapitre 9. 



try.. except.. finally 



Pour simplifier le code, il est aussi possible d'unifier les directives except et fi nally 
imbriquees depuis Python 2.5.1. 

Unification 

>» try: # avant 2.5.1 
try: 

print('le code') 
except : 

print("l 'erreur") 
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. . . finally: 

... print("l 'ultime operation") 

le code 

l'ultime operation 

>» try: # depuis 2.5.1 

print('le code') 
except : 

print("l 'erreur") 
f i nal 1 y : 

print("l 'ultime operation") 

le code 

l'ultime operation 

>» 



Les list comprehensions 



Les list comprehensions sont des expressions qui permettent de generer des listes 
d'une maniere tres compacte, sans avoir a utiliser de boucles si les elements doivent 
etres testes ou traites avant d'etre integres dans la liste, ni les fonctions map(), 
reduce() ou filter(). 

L'expression est de la forme : 

I [expression for expression in sequence [if test]] 

Exemples de list comprehensions 

>» sentence = "voici une liste de mots" . split() 

>» sentence 

['voici', 'une', 'liste', 'de', 'mots'] 

>» sentence2 = [word. upper() for word in sentence] 

>» sentence2 

['VOICI', 'UNE', 'LISTE', 'DE', 'MOTS'] 

>» sentence2 = [word for word in sentence2 if word != "UNE"] 

>» sentence2 

['VOICI', 'LISTE', 'DE', 'MOTS'] 

»> [3*i for i in range(4)] 

[0, 3, 6, 9] 

>» [i for i in range (4) if i > 2] 

[3] 

>» [i for i in range (6) id i != 4 and i > 2] 

[3, 5] 
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Cette ecriture combinee reduit considerablement le code necessaire a la composition 
de certaines listes. Si die devient difficile a lire, il faut envisager une boucle classique. 
Le meme code sans list comprehensions est trois fois plus long. 

Meme code sans list comprehensions (sans utilisation de map()) 

>» sentence = "voici une liste de mots" . spin t() 

>» sentence 

[ ' voi ci ' , ' une ' , ' 1 i ste ' , ' de ' , ' mots ' ] 

>» sentence2 = [] 

>» for word in sentence: 

sentence2 .append (wo rd.upperO) 

>» sentence2 

['VOICI', 'UNE', 'LISTE', 'DE', 'MOTS'] 

>» sentence3 = [] 

>» for word in sentence2: 

if word != 'UNE' : 
... sentence3.append(word) 

>» sentence2 = sentence3 

>» sentence2 

['VOICI', 'LISTE', 'DE', "MOTS'] 

>» 1 = [] 

>» for i in range(4): 

... 1 . append (i*3) 



>» 


1 




[0, 


3, 6, 9] 




>» 


1 = [] 




>» 


for i in range(4) : 
if i > 2: 






1 .appendO 


) 


>» 


1 




[3] 






>» 


1 = [] 




>» 


for u in range(6) : 
if u != 4: 
1 .append(u) 




>» 


12 = [] 




>» 


for i in 1 : 
if i > 2: 

12. append (i) 




>» 


12 




[3, 


5] 
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Generators et iterators 



Iterators 



A chaque fois qu'un objet est utilise dans une boucle for, l'interpreteur genere en 
interne un iterator avec lequel il travaille. Un iterator est un objet qui contient une 
methode next() qui est appelee a chaque cycle et qui renvoie la sequence, element 
par element. Lorsqu'il n'y a plus d'elements, l'iterator declenche une exception de 
type Stoplteration. 

Les objets iterators peuvent etre crees par le biais de la primitive iter() qui prend en 
parametre tout objet compatible avec les iterations. 

Iterator sur objet liste 

>» 1ist_ = [1, 2, 3] 

>» iterator = iter("list_) 

>» iterator. next() 

1 

>» iterator. next() 

2 

>» iterator. next() 

3 

>» iterator. next() 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
Stoplteration 

Un objet compatible avec les iterations est un objet qui implemente une methode 

iter (). La primitive iter() appelle et renvoie le resultat de cette methode 

lorsqu'un objet lui est fourni en parametre. 

Iterator de liste 

>» list_ = [1, 2, 3] 

>» iterator = list_. iter () 

>» iterator. next() 

1 

>» iterator. next() 

2 

>» iterator. next() 

3 

>» iterator. next() 

Traceback (most recent call last): 



File "<stdin>", 
Stoplteration 



line 1, in ? 
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La methode la plus simple pour rendre un objet compatible avec les iterations est d'y 
implemented directement la methode next() et de renvoyer self dans iter (). 

Iterator simple 

>» class Iterable: 
index = 

... def iter (self): 

return self 
def next(self) : 
... if self .index > 5 : 

... raise Stoplteration 

self .index += 1 
... return self. index 

>» for element in Iterable(): 
print(element) 

1 
2 
3 
4 
5 
6 



A SAVOIR Gestion des iterators avec itertool 

Le module i te rtool , presente dans le chapitre 8, fournit des utilitaires rapides de creation et de mani- 
pulation d'iterators. 



Generators 



Les generators permettent de generer de maniere tees simple et tees puissante des ite- 
rators. La creation d'un iterator par le biais d'un generator se resume a l'ecriture d'une 
fonction qui parcourt les elements de la sequence. Au lieu de retourner ces elements 
par la directive return, la fonction doit faire appel a la directive yield, qui sert a 
definir un point de sauvegarde. 

Cette fonction peut ensuite etre utilisee dans une boucle for sans avoir a imple- 
menter toute la garniture necessaire a un iterator, ou a gerer la levee d'une exception 
Stoplteration. 

Generator simple 

>» def iterable(): 

... print('debut de boucle') 
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for i in range(6) : 
... yield i + 1 

>» for element in iterable(): 
print(element) 

debut de boucle 

1 
2 
3 
4 
5 
6 



L'interpreteur utilise la fonction a chaque iteration en memorisant son etat, la direc- 
tive yield constituant en quelque sorte un return avec point de sauvegarde de l'etat 
des variables locales et de l'endroit ou le code de la fonction a ete quitte. Le prochain 
appel a la fonction reprendra a cet endroit. 



Generator expression (genexp) 

II est possible d'utiliser une notation abregee pour creer un generator, a l'aide d'une 
generator expression. 

Ces expressions sont d'une forme equivalente aux list comprehensions .-(expression for 
expression in sequence [if test]), et renvoient un objet generator. 

Exemples de generator expression 



>» genexp = (i for i in range(5) if i % 2 

>» genexp. next() 



>» genexp. next() 

2 

>» genexp. next() 

4 

>» genexp. next() 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
Stoplteration 

>» genexp = (i for i in range(5) if i % 2 
>» for element in genexp: 
print(element) 



0) 



0) 
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En un mot... 



Des qu'un programme grossit, une structuration en classes, modules et paquets faci- 
lite grandement son evolution, sa lisibilite et sa maintenance. 

Le prochain chapitre presente les primitives du langage, qui sont toutes les fonction- 
nalites directement accessibles venant etoffer la syntaxe. 
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Les primitives 



Les primitives sont des fonctions directement accessibles dans l'interpreteur, aussi 
appelees built-ins. Ces fonctions sont toutes du type builtin_function_or_method 
et sont regroupees dans le module bun 1 ti ns . 



Attention Fonctions de transtypage 

Lorsqu'ils sont utilisables comme des fonctions de transtypage, certains types sont presentes dans ce 
chapitre alors qu'ils ne sont pas des builtin_funct"ion_or_method. 



Allant de la simple transformation de valeurs aux fonctionnalites plus elaborees, les 
primitives sont le couteau Suisse du developpeur Python. 

Ce chapitre presente un referentiel complet des primitives et comporte deux parties. 
La premiere partie porte sur tous les elements qui ne sont pas des classes d'exception, 
lesquelles sont regroupees dans la deuxieme partie. 

L'interpreteur est aussi un bon allie lors de la manipulation des primitives : help(x) 
permet d'afficher un ecran d'aide sur 1'utilisation de x. 
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Affichage de I'ecran d'aide d'abs 

>» help(abs) 

Help on built-in function abs in module builtin_ 

abs(...) 

abs(number) -> number 

Return the absolute value of the argument. 



Primitives du langage 

import : import (nom, globals={}, locals={}, fromlist=(), Icvcl=- 

1) -> module 

import sert a importer un module comme le ferait une directive import clas- 

sique. L'environnement local et global peuvent etre passes en parametre, et f roml i st 
permet quant a lui d'emuler la directive from. 

Enfin, level est un drapeau qui permet de determiner si les imports sont relatifs ou 
absolus. 

• Un nombre del an definit le nombre de repertoires parents a remonter avant de 
rechercher 1' element a importer ; 

• Regie sur 0, c'est un import absolu classique ; 

• Regie sur -1, import essaye d'effectuer un import absolu ou relatif en se 

basant sur le nom fourni. 

Importations avec import 

>» import ('os. path', f romlist=['os']) 

<module 'posixpath' from ' posixpath .pyc'> 

>» import ('os') 

<module 'os' from 'os.pyc'> 

import est utilise pour des importations a effectuer apres le lancement du pro- 
gramme. Un systeme de plug-ins peut par exemple utiliser cette primitive pour 
charger a la volee un module dans un programme. 



Les primitives 

Chapitre 6 



abs : abs(nombre) -> nombre 

Renvoie la valeur absolue du nombre passe en parametre. abs peut aussi servir a recu- 
perer le module d'un nombre complexe. 



abs 



>» absC-145) 

145 

>» cplx = -3 + 2j 

>» abs(cplx) 

3.6055512754639891 



Definition Module d'un nombre complexe 

Le module d'un nombre complexe z, note |z| est un reel positif tel que \z\ = V(a2 + bl) = ^(zz*) 



all : all(iterable) -> booleen 

Renvoie True si bool (x) renvoie True pour tous les elements x de la sequence 
iterable. 

Test de I'homogeneite d'une sequence 

>» elements = [1, 23, 233, 322] 

>» all ([isinstance(el , int) for el in elements]) 

True 

>» elements = [1, 23, 233, 'k'] 

>» all ([isinstance(el , int) for el in elements]) 

False 

Dans cet exemple, all verifie que tous les objets de la liste sont des entiers. 

any : any(iterable) -> booleen 

Renvoie True si bool (x) renvoie True pour au moins l'un des elements x de la 
sequence iterable. 

Test de rhomogeneite d'une sequence 

>» elements = ['a', 23, 'b', 'c'] 

>» any([isinstance(el , int) for el in elements]) 

True 

>» elements = ['a' , 'b', 'c', 'd'] 

>» any([isinstance(el , int) for el in elements]) 

False 
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apply : apply(objet(, args(, kwargs))) -> valeur 

Permet d'appeler une methode ou une fonction avec une liste de parametres. Cette 
primitive ne doit plus etre utilisee depuis la version 2.3, au profit d'un appel direct, 
comme nous le verrons dans le chapitre suivant. 

callable : callable(objet) -> booleen 

Renvoie True si l'objet fourni est une fonction ou une methode. Si l'objet est une ins- 
tance de classe, renvoie True a condition que la classe implements une methode 
_can_C). 

cal 1 abl e s'avere pratique pour tester des objets lorsqu'une fonction execute des fonc- 
tions tierces fournies en parametre. 

Test de callable 

>» def ma_fonctionO : 

... printCAvez vous deja essaye le camembert frit ?') 

>» callable(ma_fonction) 

True 

>» chaine = "C'est extra" 

>» call abl e(chaine) 

False 



chr : chr(code) -> caractere 

Renvoie un objet string qui represents le caractere dont le code ASCII est l'entier 
code fourni en parametre. 

chr en action 

>» chr(97) 

'a' 

>» chr(97+25) 

'z' 

La fonction inverse est ord() : voiraussiord et unichr. 

dassmethod : classmethod (fonction) -> methode 

Convertit une simple fonction en une methode de classe. Une methode de classe est 
une methode qui est associee a une classe et non a ses instances. Elle peut done etre 
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appelee depuis la classe ou depuis n'importe quelle instance, sachant que dans tous 
les cas, le premier parametre implicite est la classe et non l'instance. 

cl assmethod est utilisee le plus souvent pour des fonctions qui generent une instance 
de la classe donnee. Comme il n'est pas necessaire pour cette fonction de connaitre 
autre chose que la classe, on peut alors opter pour une methode de classe. C'est le cas 
par exemple de la methode f romkeysO pour les dictionnaires. 

La methode de classe fromkeysO 

class UserDict: 

def fromkeys (els, iterable, value=None): 

d = clsO 

for key in "iterable: 
d[key] = value 

return d 
fromkeys = cl assmethod (fromkeys) 

L'usage veut que le premier parametre soit note cl s en lieu et place de sel f . 

fromkeysO peut done etre appelee directement depuis la classe ou depuis une ins- 
tance. 

Appel de fromkeysO 

>» from UserDict import UserDict 

>» UserDict. fromkeys(['a' , 'b', 'c'], 0) 

{'a': 0, 'c': 0, 'b': 0} 

>» dico = {} 

>» di co . fromkeys ( [ ' a ' , ' b ' , ' c ' ] , 0) 

{'a': 0, 'c': 0, 'b': 0} 

Enfin, il est possible d'utiliser le decorator cl assmethod pour simplifier i'ecriture. 

Utilisation du decorator 

class UserDict: 

@cl assmethod 

def fromkeys (els, iterable, value=None): 

d = clsO 

for key in iterable: 
d[key] = value 

return d 

Voir aussi: staticmethod. 
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cmp : cmp(x, y) -> entier 

Compare x et y et renvoie : 

• un entier negatif si x < y ; 

• un entier positif si x > y ; 

• zero si x == y. 

En general, renvoie -1, 1 et 0. 

cmp() a I'oeuvre 

>» cmpC'a', 'b') 

-1 

>» cmp(2, 1) 

1 

>» cmp(None, None) 



Pour les instances de classe, cmp() se base sur l'entier retourne par la methode 
cmp () si elle est implementee. 

Les operateurs de comparaison (>=, <=, !=, <> et ==) utilisent cmp() pour renvoyer 
leurs resultats. 

Implementation de cmp 

>» class Susceptible: 

... def cmp (self, l_autre): 

... printC Comment osez-vous me comparer a lui !') 
return 1 

>» a = SusceptibleO 

>» cmp(a, 2) 

Comment osez-vous me comparer a lui ! 

1 

>» a < 1 

comment osez-vous me comparer a lui ! 

False 



coerce : coerce(x, y) -> (xl, yl) 

Rarement utilisee, coerce permet de convertir deux objets numeriques x et y en un 
type commun lorsque c'est possible. Renvoie un tuple avec les deux valeurs homogenes. 

Dans le cas ou l'operation est impossible, ou si les parametres ne sont pas des objets 
numeriques, leve une exception TypeError. 
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Homogeneisation par coerce() 

>» coerce(l, 2.5) 

(1.0, 2.5) 

>» coerce('b' , 'a') 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
TypeError: number coercion failed 



compile : compile(source, fichier, mode(, flags(, dont_inherit))) -> objet 
code 

Python permet de compiler a la volee du code source. Le resultat de cette compila- 
tion est ensuite interpretable par le biais des primitives exec() ou eval (). 

Les parametres sont : 

• source : une chaine de caracteres contenant le code, que ce soit le texte complet 
d'un module, une expression ou une suite de lignes. 

• fichier : fichier recueillant les messages des erreurs eventuellement survenues 
lors de compilation. 

• mode : chaine de caracteres pouvant prendre les valeurs exec, si ngl e ou eval : 

- exec : pour compiler les modules. 

- si ngl e : pour compiler une serie d'instructions. 

- eval : pour compiler une expression. 

• f 1 ags : permet de faire varier le fonctionnement du compilateur en integrant des 
clauses du module future . 

• dont_inherit : si cet entier est different de zero et si le code qui appelle 

compileO possede des appels a des directives du module future , leur effet 

est bloque. Si dont_inherit vaut zero ou n'est pas specifie, le code appele par 
compileO herite de 1' effet. 

Compilation sous Linux 

>» byte_code = compile("print(' Je suis vivant !!!')", '/dev/null', 

'single') 

>» byte_code 

<code object <module>? at 0xb7clbde0, file "/dev/null", line 1> 

>» exec(byte_code) 

Je suis vivant ! ! ! 

Voir aussi : eval , execf i 1 e . 
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A SAVOIR Les fichiers .pyc et .pyo 

Les fichiers .pyc ou .pyo qui apparaissent pour chaque fichier . py execute sont le fruit d'un appel a 
compile O . 



delattr : delattr(objet, nom) 

Supprime un attribut nomme d'un objet. Equivalente a del ob jet. nom, cette fonc- 
tionnalite doit etre utilisee avec precaution car la suppression d'un attribut peut 
entrainer des problemes si cet attribut est utilise par du code tiers. 

Utilisation de delattr, attention aux impacts 

>» import UserList 

>» my_list = UserList.UserListO 

>» my_list. append C't') 

>» my_list 

['f ] 

>» delattr(my_list, 'data') 

>» my_list . append (' t') 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "/usr/lib/python2 .4/UserList .py" , line 73, in append 
def append(self, item): self .data. append(item) 
AttributeError: UserList instance has no attribute 'data' 

Cette methode est rarement utilisee dans le cadre d'un programme classique. Seules 
les bibliotheques qui modifient en bas niveau le fonctionnement de certaines classes 
de Python en ont l'usage. Les tests unitaires peuvent aussi s'en servir pour modifier 
temporairement certains mecanismes. Si votre programme utilise cette fonction dans 
un cadre classique, c'est en general un probleme d'architecture et un refactoring peut 
s'averer necessaire. 

Voir aussi : setattr, hasattr et getattr. 

dir : dir((objet)) -> liste d'attributs 

Renvoie une liste des attributs de l'objet. Si l'objet n'est pas fourni, renvoie les attri- 
buts disponibles dans le contexte d'execution. Les attributs du contexte sont par 
exemple tous les modules prealablement importes. 

Les attributs renvoyes lorsqu'un objet est fourni sont : 

• pour les objets de type classe ou type : les attributs et tous les attributs des types de 
base ; 



Les primitives 

Chapitre 6 

• pour les objets de type module : les attributs du module ; 

• pour les instances de classe : les attributs, les attributs de la classe et tous les attri- 
buts des classes dont la classe herite. 

Test de dir() sur differents objets 

>» import UserDict 

>» dir() # attributs du contexte 

['UserDict', ' builtins ', ' doc ', ' file ', ' name ', 

'readline', ' rl completer'] 

>» di r(UserDict)# attributs du module UserDict 

['DictMixin' , 'IterableUserDict ' , 'UserDict', ' builtins ', 

'_doc_', ' file ' , '_name_'] 

>» di r(UserDict. UserDict) # attributs de la classe UserDict 

[' cmp ', ' contains ', ' delitem ', ' doc ', ' getitem ', 

' init ', ' len ', ' module ', ' repr ', ' setitem ', 

'clear ', 'copy ' , 'fromkeys', 'get', 'has_key', 'items', 'iteritems', 

'iterkeys', ' itervalues' , 'keys', 'pop', 'popitem', ' setdefault ' , 

'update' , 'values'] 

>» diet = UserDict. UserDictO 

>» dir(dict)# attributs de 1'objet diet 

[' cmp ', ' contains ', ' delitem ', ' doc ', ' getitem ', 

' init ', ' len ', ' module ', ' repr ', ' setitem ', 

'clear ', 'copy ' , 'data', 'fromkeys', 'get', 'has_key', 'items', 
'iteritems', 'iterkeys', 'itervalues', 'keys', 'pop', 'popitem', 
' setdef aul t ' , ' update ' , ' val ues ' ] 

La fonction di r() est tres pratique dans l'interpreteur pour rechercher des informa- 
tions sur les objets ou modules que Ton utilise sans avoir la mise en page imposee par 
he! p(). C'est cette fonction qui est utilisee pour l'autocompletion. 



Rappel Utilisation de l'autocompletion 

L'autocompletion est parametrable dans le prompt, comme decrit dans le chapitre 3 (script de demarrage 
du mode interactif). 



Utilisation de la touche Tabulation 

>» from UserDict import UserDict 

>» dico = UserDictO 

>» dico. # utilisation de <tab> 

dico. class dico. repr dico. iteritems 

dico. cmp dico. setitem dico. iterkeys 

dico. contains dico. clear dico. itervalues 

dico. delitem dico. copy dico. keys 
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dico. doc 

dico. getitem_ 

dico. "init 

dico. len 

dico. module 

>» dico. 



dico. data 
dico.f romkeys 
dico. get 
dico.has_key 
dico. items 



dico. pop 
dico.popitem 
dico.setdefault 
dico. update 
dico. values 



divmod : divmod(x, y) -> (division entiere, modulo) 

Renvoie le tuple : ((x-x%y)/y , x%y) qui est une division entiere suivie du modulo. 
Utilisation de divmod 

>» divmod (10, 5) 
(2, 0) 

>» divmod (10, 4) 
(2, 2) 



enumerate : enumerate(iterable) -> indice, element 

Renvoie un objet de type enumerate a partir d'un objet qui supporte les iterations 
(appele iterable), comme les listes ou les tuples. 

Souvent utilise pour indexer les listes, un objet enumerate renvoie a chaque iteration 
un tuple (indice, element) ou indice est un entier variant de a n-1 et element 
1' element i ndi ce de la sequence de n elements fournie. 

Iteration sur une sequence 

>» for indice, element in enumerate([ 'a' , 'b', 'c']): 
print('%s: %s' % (indice, element)) 

0: a 
1: b 
2: c 



eval : eval(source(, globalsf, locals))) -> valeur 

Execute source en utilisant le contexte d'execution de global s et locals, source 
peut etre une chaine de caracteres contenant une expression Python ou un objet de 
type code prealablement obtenu par compile(). 

global s doit etre un dictionnaire contenant le contexte global et locals un diction- 
naire contenant le contexte local. Si ces elements ne sont pas fournis, eval utilise les 
contextes en cours. Si seul global s est fourni, local s prend alors la meme valeur. 
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Execution de code par eval 

>» evalC'a-2', {'a': 12}) 

10 

>» eval ('"a vaut %d" % a', {'a': 12}) 

'a vaut 12' 

Voir aussi: execf i 1 e, gl obal s, 1 oca! s. 

execfile : execfile(filename(, globals(, locals]]) 

Execute un script Python contenu dans un fichier. Comme pour eval , gl obal s et 
locals sont des mappings permettant de definir un contexte d'execution. S'ils sont 
omis, le contexte courant est utilise. Si seul globals est fourni, locals prend la 
meme valeur. 

Voir aussi : eval, globals, locals. 

exit : exit -> string 

exi t est une chaine de caracteres speciale qui peut etre appelee dans le prompt. 
Appel d'exit 

>» exit 

'Use Ctrl-D (i.e. EOF) to exit.' 

Son role est d'indiquer a l'utilisateur comment sortir du prompt s'il ne connait pas 
encore le signal de fin obtenu avec ce raccourci et tente instinctivement la commande 
exit. Equivalente a quit. 

Voir aussi : quit. 

file : file(nom(, model, buffering))) -> objet file 

Permet d'ouvrir le fichier nomme nom. Le parametre mode peut prendre differentes 
valeurs : 

• r : ouverture pour lecture (mode par defaut) ; 

• w : ouverture pour ecriture, le fichier est cree s'il n'existe pas, sinon son contenu 
est ecrase ; 

• a : ouverture pour ajout, le fichier est cree s'il n'existe pas, sinon son contenu est 
conserve et l'ecriture est effectuee a la suite. 
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Chacun de ces modes peut s'enrichir d'options supplementaires : 

• b : pour les operations sur les fichiers binaires ; 

• + : pour permettre la lecture et l'ecriture simultanees ; 

• U : permet de standardiser le traitement des retours a la ligne du fichier en cours de 
lecture. lis seront tous vus comme un caractere \n meme si le fichier est base sur un 
autre standard, comme \r\n ou \r (possible uniquement avec le mode r). L'objet 
file retourne avec cette option possede un attribut supplemental nomme 
new! i nes, qui contient tous les types de sauts de ligne rencontres dans le fichier. 

buf feri ng specifie si le fichier est ouvert avec un buffer memoire. Valeurs possibles : 

• : pas de buffer ; 

• 1 : la ligne en cours est le buffer ; 

• n : buffer contenant n caracteres (avec n>l). 

L'objet renvoye est un objet de type f i 1 e, qui contient les methodes suivantes : 

• close () : ferme le flux. 

• fl ush() : vide le tampon interne. 

• fil eno() : renvoie le descripteur de fichier. 

• isattyO : renvoie vrai si le fichier est branche sur un terminal tty 

• nextO : renvoie la prochaine ligne lue, ou provoque une exception 
Stoplteration. 

• read ( [si ze] ) : lit au plus si ze octets. Si si ze est omis, lit tout le contenu. 

• read! ine( [size]) : lit la prochaine ligne. Si size est fourni, limite le nombre 
d'octets lus. 

• read~lines([sizehint]) : appelle readlineO en boucle, jusqu'a la fin du flux. Si 
sizehint est fourni, s'arrete lorsque ce nombre est atteint ou depasse par la ligne 
en cours. 

• seek(offset[, whence]) : positionne le curseur de lecteur en fonction de la 
valeur d'offset. whence permet de faire varier le fonctionnement (0 : position 
absolue - valeur par defaut, 1 : relative a la position courante, 2 : relative a la fin 
du fichier). 

• tel 1 () : renvoie la position courante. 

• truncate ([size]) : tronque la taille du fichier. Si size est fourni, determine la 
taille maximum. 

• write(str) : ecrit la chaine str dans le fichier. 

• wri tel i nes (sequence) : ecrit la sequence de chaines. 

Les objets de type f i 1 e sont des iterateurs, qui peuvent done etre utilises directement 
comme des sequences. 
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Creation et lecture d'un fichier 



>» mon_f"ichi< 
>» mon_f"ichi< 
>» mon_fichi< 
>» mon fichii 



nfos.txt' , 'w') 
premiere info\n') 
deuxieme info\n') 



ier = open('i 

ier.write('l. 

ier.write('2 . 

ier. close() 
>» mon_fichier = open('infos.txt', 'r') 
>» for line in mon_fichier: 
print(line) 

1. premiere info 

2. deuxieme info 

Le type f i 1 e possede en outre un certain nombre d'attributs : 

• closed : renvoie vrai si le fichier a ete ferme. 

• encoding : renvoie l'encoding utilise par le fichier pour l'ecriture. Si des chaines 
Unicode sont ecrites dans le flux, elles sont encodees avec ce codec. 

• mode : renvoie le mode avec lequel le fichier a ete ouvert. 

• name : renvoie le nom du fichier. 

• new! i nes : renvoie le type de passage a la ligne utilise (\r, \n, ou \r\n), si l'option 
U a ete utilisee lors de l'ouverture du fichier. 

• sof tspace : renvoie vrai si un espace est a afficher avant lors de l'appel a la direc- 
tive print. 

La primitive file est equivalents a open. 



filter : filter(fonction ou None, sequence) -> list, tuple, ou string 

Renvoie une nouvelle sequence qui contient tous les elements de la sequence fournie 
qui repondent au critere suivant : 

I foncti on (element) == True. 

Si None est fourni a la place d'une fonction, la nouvelle sequence ne conserve que les 
elements qui sont True. 

f i 1 ter renvoie une sequence du meme type pour les types liste, tuple et string et une 
liste dans tous les autres cas. 

Filtrage 

>» def no_spc(element) : 
... return element != ' ' 
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>» res = fi"lter(no_spc, "Nous nous sentions de plus en plus a 

1 'etroit") 

>» print(res) 

Nousnoussentionsdepl usenpl usal ' etroi t 

Voir aussi : reduce, map. 

getattr : getattr(objet, nom(, defaut)) -> valeur 

Recupere l'attribut nom de l'objet. Equivalente a objet.nom. Si l'attribut n'existe pas, 
une erreur est provoquee, sauf si defaut est fourni : il est alors renvoye. 

getattr en action 

>» import UserDict 

>» diet = UserDict. UserDictC) 

>» diet ['a'] = 1 

>» getattr(dict, 'data') 

{'a': 1} 

>» getattr(dict, 'data2') 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
AttributeError: UserDict instance has no attribute 'data2' 
>» getattr(dict , 'data2', 'attribut inconnu') 
'attribut inconnu' 

Voir aussi : hasattr, setattr. 

globals : globals() -> dictionnaire 

Renvoie un dictionnaire contenant toutes les variables globales du contexte. 
Utilisation de globals 

>» global s() 

{' builtins ': <module ' builtin ' (built-in)>, ' file ': '/etc/ 

pythonrc.py ' , ' name ': ' main ', ' doc ': None} 

>» a = 9 
>» global s() 

{'a': 9, ' builtins ': <module ' builtin ' (built-in)>, ' file ': 

'/etc/pythonrc.py ' , ' name ': ' main ', ' doc ': None} 

Voir aussi : locals. 



Les primitives 

Chapitre 6 



hasattr : hasattr(objet, nom) -> booleen 

Renvoie True si l'objet possede bien l'attribut nom. 

Verification des attributs 

>» import UserDict 

>» dico = UserDict .UserDictO 

>» hasattr(dico, 'data') 

True 

>» hasattr(dico, 'data2') 

False 

Voir aussi : setattr, getattr, isinstance. 

hash : hash(objet) -> integer 

Renvoie un hash pour l'objet lorsque c'est possible (les objets qui peuvent etre modi- 
fies ne peuvent pas avoir de hash). Le hash est calcule en fonction de la valeur de 
l'objet. 

Calculs de hash 

>» liste_l = ('a', 'b', 'c') 

>» liste_2 = ('a', 'b', 'c') 

>» hash(liste_l) 

381002522 

>» hash(liste_2) 

381002522 

Les hash peuvent etre utilises pour indexer des objets. C'est le cas par exemple pour 
les dictionnaires, qui se servent en interne du hash des objets utilises comme cles. 

Voir aussi rid. 

help : Fonction d'aide en ligne 

he! p est un raccourci vers la fonction he! p du module pydoc . C'est une aide en ligne 
qui fournit une interface pour naviguer facilement dans la documentation contenue 
dans les docstrings. 

Cette documentation est aussi directement accessible par l'attribut doc des 

modules, classes, fonctions et methodes. 
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Utilisation de help sur filter 

>» help (filter) 

Help on built-in function filter in module builtin : 

filter(...) 

filter(function or None, sequence) -> list, tuple, or string 

Return those items of sequence for which function(item) is true. If 
function is None, return the items that are true. If sequence is a 
tuple 

or string, return the same type, else return a list. 



hex : hex(nombre) -> representation hexadecimale 

Renvoie une chaine de caracteres representant la forme hexadecimale d'un entier ou 
un entier long. 

hex 

>» hex(253) 
'OxfcT 
>» hex(2) 
'0x2' 

Voir aussi : oct. 

id : id(objet) -> entier 

Renvoie un identifiant unique pour un objet donne. Correspond a l'adresse memoire 
de l'objet. Lorsque deux objets de type immuable ont la meme valeur, l'interpreteur 
peut decider de ne conserver qu'un seul objet en memoire, et les identifiants devien- 
nent alors identiques. 

Identifiants d'objets 

>» chaine = 'abcdef 

>» chaine2 = 'abcdef 

>» id(chaine) 

549920 

>» id(chaine2) 

549920 

>» id(3) 

16793968 

>» t = 3 

>» id(t) 

16793968 
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input : input([prompt]) -> valeur 

Permet d'executer une expression fournie par l'utilisateur. Equivalente a 
eval (raw_input(prompt)). Si prompt n'est pas fourni, la fonction equivaut a 
eval (raw_input()). 

Saisie d'expression 

>» input('saisissez une expression: ') 

saisissez une expression: 2 *4 

8 

>» input() 

9+1 

10 

Voir aussi : raw_i nput. 

int : int(x[, base)) -> entier 

Conversion d'une chaine de caracteres ou d'un nombre vers un entier. Si le nombre 
est de type f 1 oat, la partie fractionnaire est tronquee. Lorsque le parametre est de 
type string, l'argument optionnel base peut etre fourni pour definir une base diffe- 
rente de la base 10. 

Conversions en entier 

>» intC'll' , 16) 

17 

>» int('ll') 

11 

>» int(5.6787) 

5 

Voir aussi : long. 

intern: intern(string) -> string 

Ajoute l'objet string fourni en parametre a une liste globale bas niveau d'objets 
stri ng utilisee pour accelerer les recherches dans les cles des objets de type diction- 
naire. Renvoie l'objet string lui-meme. Rarement utilise. 



Elements du langage 

Deuxieme partie 

isinstance : isinstance(objet, classe ou type ou tuple) -> booleen 

Permet de tester si un objet est d'un type donne ou une instance d'une classe. Un 
tuple peut aussi etre fourni pour representer une liste de types et/ou classes pour 
definir si l'objet appartient a Fun des types ou l'une des classes. 

Souvent utilise pour controler des parametres entrants dans une methode ou une 
fonction, i si nstance permet de pallier le non-typage des variables. 

Test des types et classes 

>» "isinstanceC test ' , (Unicode, str)) 

True 

>» "isinstanceC test ' , int) 

False 

>» isinstance([ 'test' , 'deux'], list) 

True 

>» from UserDict import UserDict 

>» diet = UserDictO 

>» isinstance(dict, UserDict) 

True 

Voir aussi : issubclass. 

issubclass : issubclass(C, B) -> bool 

Verifie si la classe C derive de la classe B. Comme pour i si nstance , B peut etre rem- 
place par un tuple representant une liste de classes, i ssubel ass renvoie alors vrai si C 
herite au moins de l'une des classes de la sequence. 

Test de I'heritage 

>» class B: 
pass 

>» class A(B) : 
pass 

>» issubclass(A, B) 

True 

>» issubclass(B, A) 

False 

Voir aussi : isinstance. 
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iter : iter(collection) -> iterateur ou iter(callable, sentinelle) -> iterateur 

Renvoie un iterateur construit a partir : 

• d'une collection ; 

• d'un couple call able-sentinelle. 

Dans le cas d'une collection, le parametre doit etre une sequence. Dans le cas du 
couple callable-sentinel, le premier argument est une fonction ou une methode 
qui renvoie les valeurs une a une. L'iteration s'arrete lorsque la fonction renvoie la 
valeur definie par senti nel 1 e. 

Creation d'iterateurs 



>» a = 

>» def iterator(): 
global a 
a += 1 
return a 



= iter(iterator, 4)# iterateur par sentinelle 
. next() 

. next() 

. next() 

= iter([l, 2, 3, 4])# iterateur construit avec une sequence 
. next() 

. next() 

. nextQ 



>» i 

>» i 

1 

>» i 

2 

>» i 

3 

>» i 

>» i 

1 

>» i 

2 

>» i 

3 

>» i . next() 

4 



len : len(objet) -> entier 

Renvoie le nombre d'elements d'une sequence. Lorsque l'objet fourni est un map- 
ping, renvoie le nombre d'elements de la sequence representant la liste des cles, 
len(dico) etant equivalent a len(dico.keysQ). 
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Calculs de longueurs 



>» dico = {'a' : 1, 'b' : 2, 'c' 

>» 1 en (dico) 

3 

>» my_list = ['a', 'b', 'c'] 

>» len(my_list) 

3 

>» title = 'The life of Brian' 

>» len(title) 

17 



3} 



license : license() -> prompt interactif 

Prompt interactif permettant d'afficher les informations de licence et l'historique des 
versions de Python. 

Affichage des informations de licence 



>» license() 

A. HISTORY OF THE SOFTWARE 



Python was created in the early 1990s by Guido van Rossum at Stichting 
Mathematisch Centrum (CWT, see http://www.cwi.nl) in the Netherlands 
as a successor of a language called ABC. Guido remains Python's 
principal author, although it includes many contributions from others. 

In 1995, Guido continued his work on Python at the Corporation for 
National Research Initiatives (CNRI, see http://www.cnri.reston.va.us) 
in Reston, Virginia where he released several versions of the 
software. 

In May 2000, Guido and the Python core development team moved to 
BeOpen.com to form the BeOpen PythonLabs team. In October of the same 
year, the PythonLabs team moved to Digital Creations (now Zope 
Corporation, see http://www.zope.com). In 2001, the Python Software 
Foundation (PSF, see http://www.python.org/psf/) was formed, a 
non-profit organization created specifically to own Python- related 
Intellectual Property. Zope Corporation is a sponsoring member of 
the PSF. 

All Python releases are Open Source (see http://www.opensource.org for 

Hit Return for more, or q (and Return) to quit: q 

>» 
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list : list() -> nouvelle liste ou list(sequence) -> nouvelle liste 

Permet de generer un nouvel objet liste, vide dans le premier cas et initialise avec la 
sequence fournie dans le deuxieme cas. 1 i ste = list() est equivalent a liste = []. 

sequence peut etre un objet de type sequence comme une liste, un tuple ou un objet 
de type string, mais aussi un mapping. Dans ce cas, c'est la sequence representant la 
liste des cles qui est utilisee pour construire la liste. 

Construction de listes 



>» liste = list({'a' :1}) 

>» 1 i ste 

['a'] 

>» listO 

[] 

>» list('fun matters') 

['f , 'u' , 'n', ' ', 'm', 'a', 't' , 't', 'e' , 'r', 's'] 

>» 

La forme 1 i ste = 1 i st(tupl e) est souvent utilisee pour rendre un tuple modifiable. 



locals : localsO -> dictionnaire 

Renvoie un objet dictionnaire contenant les variables locales du contexte en cours. 
Contexte local d'une fonction 



>» def fonction(): 
a = 12 
print localsO 

>» fonctionO 
{'a': 12} 

Voir aussi : global s. 



map : map(fonction, sequence!, sequence...]) -> liste 

map() renvoie une liste correspondant a l'ensemble des elements de la sequence. 
Avant d'etre insere dans la liste, chaque element est passe a la fonction fournie. Cette 
derniere doit done etre de la forme : 



I fonction (element) ^element 



Elements du langage 

Deuxieme partie 

Lorsque plusieurs sequences sont fournies, la fonction recoit une liste d'arguments 
correspondants a un element de chaque sequence. Si les sequences ne sont pas de la 
meme longueur, elles sont completees avec des elements a la valeur None. 

La fonction peut etre definie a None, et dans ce cas tous les elements des sequences 
fournies sont conserves. map(None, sequence) est equivalent a sequence et 
map(None, sequencel, sequence2) a zip(sequencel, sequence2) (mais s'arrete 
lorsque le dernier element de la sequence la plus courte est atteint). 

Utilisation de map 

>» def get_ti tie (element) : 
... return element .title () 

>» map(get_t"itle, ['fiat lux', 'the named is the mother of all 

things']) 

['Fiat Lux', 'The Named Is The Mother Of All Things'] 

>» map(None, 'hlowrd', 'el ol') 

[('h', 'e'), C'T, '1'), ('o', ' '), C'w', 'o'), C'r', 'T), ('d', 

None)] 

>» map(str, [1, '2', 3, 4]) 

['1', '2', '3', '4'] 

Voir aussi : filter, reduce, zip. 

max : max(sequence) -> valeur 

max() renvoie 1' element le plus grand de la sequence. Si plusieurs sequences sont 
fournies, renvoie la sequence la plus grande. 

Recherche du plus grand element 

>» max ('max') 

'x' 

>» max(l, 2, 3, 4) 

4 

>» max (' Python') 

V 



Voir 



aussi : rmn. 



min : min(sequence) -> valeur 



mi n() renvoie 1' element le plus petit de la sequence. Si plusieurs sequences sont four- 
nies, renvoie la sequence la plus petite. 
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Recherche du plus petit element 

>» mi n ( ' max ' ) 

'a' 

>» min(l, 2, 3, 4) 

1 

>» mi n(' Python') 
■ p. 

>» map(ord, 'Python') 

[80, 121, 116, 104, 111, 110] 

>» min('l' , 2, 3, '4') 

2 



Voir 



aussi : max. 



oct : oct(nombre) -> representation octale. 

Renvoie une representation octale d'un entier ou d'un entier long 
Utilisation de oct 



>» oct(45383) 
'0130507' 
>» oct(4538) 
'010672' 

Voir aussi : hex. 



open : open(nom[, mode(, buffering]]) -> objet file 

Alias de f i 1 e. 
Voir aussi : f i 1 e. 



ord : ord(caractere) -> entier 

Renvoie le rang d'un caractere. Un caractere est un objet string de longueur 1. 
Rang de caracteres 



>» map(ord, 'abcdefgh') 

[97, 98, 99, 100, 101, 102, 103, 104] 



Voir aussi : chr. 
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pow : pow(x, y[, z)) -> nombre 

Calcul de la puissance, equivalent a x**y et a (x*-y) % z. Dans ce deuxieme cas, la 
primitive peut etre plus rapide que la notation directe. 

Utilisation de pow 



>» pow(2, 4) 

16 

>» pow(2, 7) 

128 



property : property (fgct= None, f set = None, fdel=None, doc=None) -> 
attribut propriete 

property permet de creer une propriete a partir d'un attribut d'objet. Ajoutee recem- 
ment, cette fonctionnalite sert a retrouver une mecanique qui existe dans d'autres 
langages orientes objet : les attributs des objets ne sont pas directement accessibles 
par les utilisateurs de l'objet mais a travers la propriete qui utilise des fonctions get() 
et set() intermediates pour atteindre l'attribut. La methode del () reste accessoire 
et est beaucoup plus specifique a Python. 

Les parametres sont : 

• f get : methode de l'objet utilisee lorsque la propriete est lue. 

• f set : methode de l'objet utilisee lorsque la propriete est affectee. 

• fdel : methode de l'objet utilisee lorsque la propriete est supprimee par del ou 
delattr. 

• doc : docstring de la propriete. 

Creation d'une propriete 

>» class MyClass(object) : 
_a = 
def get_a(self) : 

print(' voici a') 

return self, a 
def set_a(self, value): 

print('je place %s dans a' % str(value)) 

self._a = value 
def del_a(self): 

print C'je supprime a') 

del self, a 
a = property(get_a, set_a, del_a, 'Propriete a') 
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»> obj = MyClassO 

>» obj .a 

voici a 



>» obj .a = 1 

je place 1 dans a 

>» obj .a 

voi ci a 

1 

>» 

L'interet de cette ecriture est de permettre aux classes de faire evoluer le code interne 
et done les attributs sans impacter le code appelant : l'ensemble des proprietes for- 
ment la partie publiee de l'objet. 

quit : quit -> string 

qui t est un objet string qui peut etre appele dans le prompt. 
Appel de quit 

>» quit 

'Use Ctrl-D (i.e. EOF) to exit.' 

Invite a I'utilisation d'exit. 
Voir aussi : exi t. 



range : range((start,) stop[, step)) -> liste d'entiers 

Renvoie la liste des entiers variant de start a stop-1 avec un pas de step, step vaut 
1 par defaut et start 0. 

step pouvant etre un entier negatif, il est possible de faire une liste variant de 
start-1 a stop avec stop < start. 

Listes issues de range 

>» range(5) 

[0, 1, 2, 3, 4] 

>» range(4, -1, -1) 

[4, 3, 2, 1, 0] 

>» range(4, -1, -2) 

[4, 2, 0] 

>» range (0) 

[] 

range est tres frequemment utilise pour concevoir des sequences de boucle. 
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Utilisation de range dans une boucle for : 

>» for i in range(3): 
print i 


1 
2 

Voir aussi : xrange. 



raw input : raw input ([prompt]) -> string 

raw_input permet de lire l'entree standard et de renvoyer le contenu dans un objet 
string. Si prompt est fourni, il est affiche sans passage a la ligne. 

Saisie utilisateur : 

>» a = raw_input() 

12 

>» a 

'12' 

>» phrase = raw_input('saisissez une phrase: ') 

saisissez une phrase: une phrase 

>» phrase 

'une phrase' 

Si l'utilisateur envoie un signal EOF (Ctrl+Z et Entree sous MS-Windows ou Ctrl+D 
sous systemes unices), une erreur EOFError est provoquee. Elle peut etre interceptee 
pour gerer cet arret. 

Interception de EOF 

>» try: 

phrase = raw_input(' saisissez une phrase: ') 
except EOFError: 
print 'abandon' 

saisissez une phrase: [Ctrl+D] abandon 
>» 



Python 3 disparition de raw input 

raw_i nput disparatt sous Python 3, pour etre remplace par i nput. 



Voir aussi : input. 
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reduce : reduce(fonction, sequence!, initial)) -> valeur 

Appelle la fonction fournie avec les deux premiers elements de la sequence. Le 
resultat de la fonction est ensuite utilise avec le troisieme element de la sequence 
pour appeler a nouveau la fonction, et ainsi de suite. Le resultat final est done un ele- 
ment unique. 

Utilisation de reduce 

>» def somme(x, y) : 

pr-int('%d + %d" %(x, y)) 
return x + y 

>» reduce (somme, [1, 2, 3, 4]) 

1 + 2 

3 + 3 

6 + 4 

10 

i ni ti al est un parametre optionnel qui permet : 

• d'amorcer le calcul, la premiere iteration de reduce se basant sur le couple 
(i ni ti al , premier element de la sequence) ; 

• de definir une valeur par defaut si la sequence fournie est vide. 
Voir aussi : map, filter. 

reload : reload(module) -> module 

Recharge un module qui a ete prealablement charge par le biais d'une directive 
import. Lorsque le code source du fichier d'un module est modifie, les modifications 
ne seront pas effectives sans un appel a reload (module). Notons que les instances 
deja existantes ne sont pas impactees par rel oad. 

Voir aussi : import. 

repr : repr(objet) -> representation 

Renvoie une representation fonctionnelle sous forme de chaine de caracteres d'un 
objet. Cette representation est pour la plupart des types simples la chaine de carac- 
teres que l'utilisateur aurait pu saisir pour creer l'instance. 

eval (repr(object)) est done souvent equivalent a object. 

La plupart du temps, str (object) est equivalent a repr (object), mais la premiere 
notation est destinee a renvoyer une representation purement visuelle. 
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Representation d'un objet 

>» liste = [1, 2, 3, 4] 

>» repr("liste) 

'[1, 2, 3, 4]' 

>» eval (repr(liste)) 

[1, 2, 3, 4] 

>» eval (repr(liste)) == liste 

True 

Une classe peut implementer le fonctionnement de repr en definissant une methode 
repr . 

Voir aussi : str. 

round : round(nombre(, ndigits)) -> reel 

Permet d'arrondir un nombre en fonction de la precision ndigits, qui represents le 
nombre de chiffres apres la virgule. ndigits est a par defaut et peut etre negatif. 
round renvoie toujours un reel (flottant). Un entier passe en parametre est done 
transforme en reel. 

Arrondis 

>» round(4. 5687645, 3) 

4.569 

>» round(4. 5687645, 0) 

5.0 

>» round(4. 5687645) 

5.0 

>» round(5) 

5.0 

>» round(567.897, -1) 

570.0 



set : set(iterable) -> objet de type set 

Renvoie une collection non ordonnee d'elements. Le parametre doit etre un objet 
supportant les iterations. 

Creation d'une collection 

>» collection = set([l, 2, 3]) 
>» collection.popO 

1 
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>» collection. pop() 

2 

>» collection. pop() 

3 



setattr : setattr(objet, nom, valeur) 

Permet de definir la valeur d'un attribut pour un objet donne. Equivalente a 
objet.nom = valeur. 

Si l'attribut n'existe pas, une erreur AttributeError est levee lorsque l'objet ne peut 
se voir attribuer de nouveaux attributs, comme les types built-ins. 

Affectation d'attribut 



>» o = objectO 

>» setattr(o, 'a', 1) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
AttributeError: 'object' object has no attribute 'a' 
>» class F: 
pass 



>» g = FO 

>» setattr(g, 'a' 

>» g . a 

1 



1) 



Voir aussi : getattr, hasattr. 

slice : slice((start,) stop(, step)) 

Genere un objet si i ce. Les objets si i ce sont des utilitaires pour la gestion de tran- 
ches. Une fois cree, l'objet si i ce fournit une methode i ndi ces () qui prend en para- 
metre une longueur et renvoie un tuple contenant la liste des indices en fonction des 
valeurs de start, stop et step. 

Python se sert des objets si i ce lorsque des sequences sont tranchees, en generant par 
exemple l'objet si ice (a, b, c) pour la tranche sequence[a:b:c]. 

Tranches de liste 



>» my_liste = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
>» my_liste[2 : 5 :2] 
[3, 5] 
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>» my_~liste[2 : 5:1] 

[3, 4, 5] 

>» my_liste [1:2:1] 

[2] 

>» my_liste [1:4:1] 

[2, 3, 4] 

>» my_liste[l:4:2] 

[2, 4] 



sorted : sorted(iterable, cm p= None, key=None, reverse= False) -> liste 
triee 

Renvoie une liste d'elements tries en fonction des elements de l'objet iterable fourni. 
sorted() utilise une fonction de comparaison a laquelle il passe les elements deux a 
deux de l'iterable : 

• Si cmp est fourni, la fonction est utilisee pour comparer les elements deux a deux 
dans i'algorithme de tri. cmp(elementl, element2) doit renvoyer -1, ou 1. 

• Si key est fourni, elle pointe sur une fonction qui sera utilisee au moment des 
appels aux elements dans la fonction de comparaison : chaque element sera trans- 
forme par key (element) avant la comparaison. 

Lorsque key nest pas fourni, ce sont les elements qui sont directement passes a la 
fonction de comparaison. Enfin, lorsque cmp n'est pas fourni, sortedO utilise une 
fonction de comparaison generique. 

reverse permet d'inverser le resultat obtenu. 
Combinaisons possibles pour sorted 



>» def cmp(eltl, elt2): 
if eltl > elt2: 

res = -1 
elif eltl < elt2: 
res = 1 
... else: 

res = 
print('cmp(%s, %s) =%s'%(eltl, elt2, res)) 
return res 

>» def key (el t) : 

res = -ord(elt) 

pr-int("key('%s') = %s"%(elt, res)) 

return res 
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>» sorted(['c' 



key('c') 


= -99 


key ('a') 


= -97 


key('b') 


= -98 


cmp(-97, 


-99) 


cmp(-98, 


-97) 


cmp(-98, 


-99) 


cmp(-98, 


-97) 



['a', 'b', 'c'] 



' b'], cmp=cmp, key=key) 



staticmethod : staticmethod(fonction) -> methode statique 

Transforme une fonction en une methode statique. Une methode statique est une 
methode qui n'est pas dependante de l'instance de classe. Le premier parametre 
implicite qui contient cet objet n'est done pas fourni et toutes les instances de la 
classe ou la classe elle-meme pourront utiliser cette methode de la meme maniere et 
obtenir les memes resultats. 

Methode statique 



>» class MyClass(object) : 

... def static_method() : 

... printC'je suis universelle") 

... static_method = staticmethod (static_method) 

>» MyClass.static_method() 
je suis universelle 
>» instance = MyClassO 
>» instance. static_method() 
je suis universelle 

Cette ecriture peut etre remplacee par un appel par decorator. 
Ecriture abregee par decorator 

>» class MyClass(object) : 

©staticmethod 
... def static_method() : 
... print("je suis universelle") 

>» MyClass.static_method() 
je suis universelle 
>» instance = MyClassO 
>» instance. static_method() 
je suis universelle 
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Les methodes statiques de Python sont similaires a celles de Java et C++, mais il 
existe une technique un peu plus avancee : les methodes de classe, generees par la 
primitive classmethod(). 

voir aussi : classmethod. 

str : str(objet) -> representation de I'objet 

Renvoie une representation visuelle de I'objet sous forme d'un objet string. Si I'objet 
est un objet string, alors str(objet) est egal a objet. 

Cette primitive est souvent equivalente a repr(). II est possible de definir sa propre 

representation visuelle pour une classe en definissant la methode str () qui est 

appelee par str(). 

str() sert aussi a transformer des nombres en chaines de caracteres, sachant que le 
chemin inverse est possible par le biais des primitives i nt () ou f 1 oat () . 

Utilisation de str() 

>» str(6) 

'6' 

>» str([]) 

'[]' 

>» str([l, 2]) 

'[1, 2]' 

>» -int(str(6)) 

6 

Voir aussi : repr. 

sum : sum(sequence, start=0) -> valeur 

Renvoie la somme des elements d'une sequence de nombres. Tous les elements de la 
sequence doivent etre des nombres pour que sum() puisse fonctionner. Lorsque la 
sequence contient des nombres reels, le resultat renvoye est un reel, meme si la 
somme renvoie une valeur entiere. 

Si start est fourni, il definit une valeur d'amorce pour la somme, qui sera renvoyee 
au cas ou la sequence fournie est vide. 



Les primitives 

Chapitre 6 



Sommes 



>» sum([l, 2.6, 2.4]) 

6.0 

>» sum([l, 2, 3]) 

6 

>» sum([l, 2, 3] , 4) 

10 

>» sum([] , 4) 

4 



super : super(type, objet) -> objet super lie a Pobjet 

Un type peut deriver d'un autre type. Ce dernier peut lui-meme deriver d'un troi- 
sieme type. Cet arbre de derivation peut etre parcouru pour un objet d'un type donne 
grace a la primitive super (). On l'utilise le plus frequemment lorsqu'une methode est 
surchargee dans les descendants du type. On peut appeler la methode du niveau qui 
nous interesse par le biais de super () en specifiant en premier parametre le type de 
ce niveau. 

Polymorphisme de type 



>» class MyClass(object) : 
def title(self) : 

return "Moi c'est la classe\n" 

class MyClass2(MyClass) : 
def title (self) : 

return "Moi aussi\n" 

class MyClass3(MyClass2) : 
def title(self) : 

titlel = super(MyClass2, self) .title() 
title2 = super(MyClass3, self) .title() 
my_title = "Jamais deux sans trois !" 
return titlel + title2 + my_title 

>» test = MyClass3() 
>» print(test .title()) 
Moi c'est la classe 
Moi aussi 
Jamais deux sans trois ! 
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A SAVOIR super() et les definitions de classe 

Pour pouvoir faire fonctionner super () avec vos definitions de classes, il faut toujours deriver les clas- 
ses de base du type de base object, ou en faire des types : 

»» def title(self) : 

... return "Moi c'est la classe\n" 

» MyClass = type ('MyCl ass ' , () , {'title': title}) 
>» class MyClass2(MyClass) : 
def title(self) : 

return "Moi aussi\n" 

>» class MyClass3(MyClass2) : 
def title(self) : 

titlel = super(MyClass2, self) .title() 

title2 = super(MyClass3, self) .title() 
... mon_title = "Jamais deux sans trois !" 

... return titlel + title2 + mon_title 

>» test = MyClass3() 

>» print(test .title()) 

Moi c'est la classe 

Moi aussi 

Jamais deux sans trois ! : 



type : type(objet) -> type de I'objet 

Renvoie le type d'un objet. Le test type(objet) is type est equivalent a 
isinstance(type, objet). 

Essais avec type 

>» type(' texte') 
<type 'str'> 
>» type(l) 
<type 'int'> 
>» type([]) 
<type 'list'> 



type : type(nom, bases, diet) -> nouveau type 

Permet de definir un nouveau type ou une nouvelle classe de nom name, bases est un 
tuple representant l'ensemble des types dont le nouveau type doit heriter et di ct est 
un dictionnaire qui contient l'ensemble des methodes et attributs definis pour le 
type. Cette notation est a eviter au profit d'une definition explicite du nouveau type. 
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Notations equivalentes 

>» class MyType(str) :# notation explicite 
a = 1 

>» MyType = type('MyType' , (str,), {'a': 1}) 



unichr : unichr(i) -> caractere Unicode 

Renvoie un objet Unicode de longueur 1 representant le caractere de rang i. i est un 
entier compris entre et 65 536 ou entre et OxlOffff en fonction de la maniere dont 
votre interpreteur Python a ete compile. 



Python 3 Disparition de unichr() 

Puisque uni code devient le type chame de base en Python 3, cette fonction disparait. 



Voir aussi : chr. 



Unicode : unicode(string (, encoding!, errors))) -> objet 

Genere un nouvel objet Unicode en fonction d'un objet string et d'un codec specifie 
par encodi ng. Si encodi ng n'est pas fourni, le codec par defaut est utilise, soit asci i . 

errors peut prendre trois valeurs : 

• stri ct : tout caractere qui ne peut etre decode genere une erreur ; 

• repl ace : tout caractere qui ne peut etre decode est remplace par \uf f f ; 

• i gnore : tout caractere qui ne peut etre decode est retire. 

La valeur par defaut pour errors est strict et tout caractere indecodable leve une 
exception UnicodeDecodeError. 

Essais Unicode 

>» unicode('Le cafe de la place', errors='ignore') 

u'Le caf de la place' 

>» unicode('Le cafe de la place', errors=' replace') 

u'Le caf\ufffd de la place' 

>» unicode('Le cafe de la place') 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 6: 
ordinal not in range(128) 
>» unicode('The cafe de la place') 
u'The cafe de la place' 



Voir 



aussi : str. 
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AVERTISSEMENT Erreurs d'encodage et de decodage 

Les erreurs d'encodage et de decodage sont monnaie courante pour les developpeurs francophones 
etant donne que les chatnes que nous utilisons sont des caracteres de la norme ISO-8859-1 5. Certains 
appels a unicodeO se faisant dans du code de tres bas niveau sans qu'il soit possible de specifier de 
maniere simple I'encoding a utiliser, il est vivement conseille de ne jamais utiliser d'objet string pour 
representer le texte d'une application, et d'externaliser les traductions. 



Python 3 Disparition de unicodeO 

Puisque uni code devient le type chatne de base en Python 3, cette fonction disparait. 



vars : vars((objet)) -> dictionnaire 

Si objet n'est pas fourni, varsO est equivalente a "local s(). Dans le cas contraire, 
vars (ob jet) est equivalente a object. diet . 

Voir aussi : global s, locals. 

xrange : xrange((start,) stop(, step]) -> iterateur 

xrangeO est equivalente a range() mais au lieu de renvoyer une liste d'entiers, elle 
renvoie un objet xrange qui genere les entiers au fur et a mesure des besoins. Plus 
rapide et plus leger en memoire, xrange () est a preferer a range (). 

Voir aussi : range. 

zip : zip(seql (, seq2 (...))) -> ((seql(O), seq2[0]...), (•••)) 

zi p() permet de concatener des sequences. Chaque enieme element de chaque sequence 
est pris pour former un tuple. Lorsque le dernier element de la sequence la plus courte est 
utilise, la concatenation s'arrete. zi p() renvoie alors une liste des tuples formes. 

Concatenation de sequence 

>» zip([l, 2, 3, 4], [5, 6]) 

[(1, 5), (2, 6)] 

>»zip('pi', 'ys', 't ', 'hg\ 'oo', 'no', ' d') 

[('p', 'y', 't', 'h', 'o', 'n', ' '), C'i', 's', ' ', 'g', 'o', 'o' , 

'd')] 

>»zip(['a', 'b', 'c'], [1, 2, 3], ['A', 'B', 'C']) 

[('a', 1, 'A'), C'b', 2, 'B'), ('c', 3, 'C')] 
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Exceptions du langage 



Void l'ensemble des exceptions definies dans le langage, derivant toutes de classes 
d'exceptions de base, presentees dans le chapitre precedent. On retrouve ces excep- 
tions dans le module exceptions. 

On distingue deux types d'exceptions : 

• Les erreurs qui provoquent 1' arret de 1' execution du code et doivent etre intercep- 
tees par une directive try . . except. 

• Les avertissements, derives de l'exception de base Warning, utilises avec la fonc- 
tion warn du module warni ngs, et qui se contentent dans ce cas d'afficher un mes- 
sage d'avertissement sans interrompre l'execution du programme. 



A SAVOIR Les exceptions de type Warning 

Les exceptions de type Warni ng sont des exceptions comme les autres et provoquent I'arret de l'execu- 
tion du programme si elles sont utilisees directement avec une directive rai se. Seule la fonction warn 
leur donne ce fonctionnement particulier. 



Erreurs 



AssertionError 

La primitive assert () permet de controler qu'une expression renvoie True. Dans le 
cas contraire, une exception AssertionError est levee. Peut etre utilisee pourvalider 
des preconditions a l'execution du code d'une fonction. 

Validation d'un precondition 

>» def delta(a, b) : 
assert(a > b) 
return a - b 

>» delta(10, 5) 

5 

>» delta(2, 5) 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "<stdin>", line 2, in delta 
AssertionError 
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AttributeError 

Levee lorsque, pour un objet donne, l'interpreteur ne trouve pas l'attribut demande, 
ou ne peut pas lui assigner de valeur. 

Erreurs d'attributs 

>» o = [] 

>» o.i terns 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
AttributeError: 'list' object has no attribute 'items' 
>» o.i terns = 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
AttributeError: 'list' object has no attribute 'items' 

EOFError 

Levee lorsque qu'un flux de lecture de donnees rencontre le caractere de fin de fichier 
EOF. C'est le cas par exemple lorsque Ton renvoie le signal EOF (Ctrl+D sous Linux et 
Ctrl+Z sous MS-Windows) a une commande comme input(). 

Signal EOF 

>» input() # Ligne suivi d'un signal EOF 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
EOFError 

FloatingPointError 

Exception concernant les erreurs de calcul en virgule flottante. Pour pouvoir l'uti- 
liser, Python doit etre configure avec l'option -with-fpectl ou pyconfig.h doit 
definir la constante WANT_SIGFPE_HANDLER. Cette option est activee dans une installa- 
tion Python par defaut. 

lOError 

Exception levee lorsqu'une operation de lecture ou d'ecriture echoue. Voir 1' excep- 
tion parent Envi ronmentError dans le chapitre precedent pour les parametres du 
constructeur. 
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Exemples d'erreurs systeme 



>» mon_fichier = open(' jexistepas ' , 'r') 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
IOError: [Errno 2] No such file or directory: 'jexistepas' 
>» mon_fichier = open (' /root/. ssh/known_hosts' , 'r') 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
IOError: [Errno 13] Permission denied: '/root/. ssh/known_hosts' 

ImportError 

Concerne les erreurs relatives au chargement d'un module ou d'un element de 
module lors de rutilisation de la directive import ou from. Si le nom de i'element 
n'est pas trouve, I'interpreteur leve une exception ImportError. 

Indentation Error 

Provoquee lorsque I'interpreteur rencontre une erreur d'indentation de code. 

IndexError 

Exception utilisee lorsqu'un indice de sequence est hors limites. 
IndexError 

>» liste = [1, 2, 3] 

>» liste [12] 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
IndexError: list index out of range 

KeyError 

Exception utilisee lorsqu'une cle de mapping n'existe pas dans la liste des cles. 

KeyError 

>» dico = {'a' : 12} 

>» dico['b'] 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
KeyError: 'b' 
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Keyboardlnterrupt 

Provoquee lorsque l'utilisateur utilise une interruption (Ctrl+C). Permet 1' arret de 
1' execution d'un programme. 

Sortie de programme par Ctrl+C 



>» import time 
>» while True: 

time. sleep (0.2 5) 
print('.') 



ACTraceback (most recent call last): 

File "<stdin>", line 2, in ? 
Keyboardlnterrupt 



MemoryError 

Exception provoquee lorsqu'un programme n'a plus de memoire disponible au 
moment d'une allocation ou d'un calcul. II est possible dans ce cas de tenter de liberer 
de la memoire par le biais de la directive del . 



NameError 

Provoquee lorsqu'un nom utilise n'existe pas dans le contexte d'execution en cours, 
que ce soit dans la liste des variables locales ou dans celle des globales. 

NotlmplementedError 

Utilisee dans le corps des methodes qui n'ont pas encore ete codees, ou dans les 
methodes abstraites qui n'ont aucune implementation et doivent etre surchargees 
dans les classes derivees. 

Une classe abstraite qui definit des methodes utilise NotlmplementedError en lieu et 
place de pass. Equivalents aux methodes virtuelles pures du langage C++. 

Methode abstraite 

>» class MaClass: 

def methodeO : 
... raise NotlmplementedError 
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OSError 



Levee pour toute erreur systeme. Utilisee pour toutes les fonctions implementees 
dans le module os. Voir l'exception parent Envi ronmentError dans le chapitre prece- 
dent pour les parametres du constructeur. 

OverflowError 

Utilisee lors d'un depassement de capacite. 

Controle de depassement de capacite par xrange 

>» xrange (lelOO, lelOl, lelOl) 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
OverflowError: long int too large to convert to int 

Pour les entiers, le passage d'un entier a un entier long etant automatique, aucune 
exception de type OverflowError ne sera levee. II est done necessaire de faire le con- 
trole explicitement. 

ReferenceError 

Provoquee lorsqu'un proxy cree par la fonction proxyO du module weakref tente 
d'acceder a un objet qui n'existe plus, e'est-a-dire supprime par le ramasse-miettes. 



Version Module weakref 

Cette exception etait, jusqu'a la version 2.2, dans le module weakref. 



RuntimeError 

Exception issue des anciennes versions de Python et tres rarement utilisee dans les 
versions actuelles, permet de signaler des erreurs inclassables. 

Stoplteration 

Utilisee pour signaler la fin d'une sequence dans les iterateurs. Cette exception est 
interceptee par l'interpreteur pour terminer une boucle for. 

SyntaxError 

Levee par l'interpreteur lorsqu'il rencontre une erreur de syntaxe au moment de la 
lecture du code. Outre le message d'erreur, possede des informations utiles sur 
l'erreur, comme le nom du fichier (filename), le numero de ligne (lineno), la 
colonne (offset) et enfin le texte (text). 
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SystemError 

Provoquee lorsque l'interpreteur rencontre une erreur interne non fatale. 

SystemExit 

Cette exception est levee par la fonction exi t du module sys et declenche la sortie de 
l'interpreteur Python. Elle peut prendre en parametre de constructeur un entier qui 
sera renvoye par l'interpreteur au systeme comme code de sortie du programme 
(0 par defaut). Si une chaine de caracteres est passee, elle sera affichee avant que 
l'interpreteur ne quitte l'execution et renvoie le code au systeme. 

II est possible d'associer une fonction a cet evenement, par le biais de la fonction 
register du module atexit. Cette fonction s'executera apres la gestion de 1' excep- 
tion et peut contenir du code de nettoyage specifique. 

Sortie de programme 



>» def finO : 

print('The End') 

>» import atexit 

>» atexit . register(f in) 

>» raise SystemExit('Arret execution') 

Arret execution 

The End 



TabError 

Provoquee lorsque l'interpreteur rencontre un melange d'espaces et de tabulations 
pour l'indentation du code. 



TypeError 

Provoquee lorsqu'un objet fourni a une operation, une fonction ou une methode, 
n'est pas du type attendu. 

TypeError 

>» 'a' +2 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
TypeError: cannot concatenate 'str' and 'int' objects 
>» 1 + 'a' 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

TypeError: unsupported operand type(s) for +: 'int' and 'str' 
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UnboundLocalError 



Provoquee lorsqu'une reference a une variable est faite sans qu'aucune valeur ne lui ait 
ete precedemment attribute. Cette erreur est provoquee lorsque l'interpreteur trouve 
dans le contexte d'execution de la variable une initialisation de sa valeur apres son utili- 
sation. Si l'interpreteur ne trouve aucune initialisation, une erreur NameError est levee. 

Initialisation tardive 

>» def fonctionO: 
print y 

... y = 1 

>» fonctionO 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "<stdin>", line 2, in fonction 
UnboundLocalError: local variable 'y' referenced before assignment 

UnicodeEncodeError 

Introduite dans la version 2.3 comme classe derivee de Uni codeError, permet de pre- 
ciser lorsqu'une erreur de conversion d'uni code est provoquee, c'est-a-dire qu'il s'agit 
d'un probleme de conversion d'uni code vers stri ng. 

Erreur d'encodage 

>» u'\u0200' .encodeO 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
UnicodeEncodeError: 'ascii' codec can't encode character u'\u0200' in 
position 0: ordinal not in range (128) 

UnicodeDecodeError 

Equivalents a UnicodeEncodeError, mais pour les problemes de conversions de 
stri ng vers uni code. 

Erreur de decodage 

>» '\xff'.decode() 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
UnicodeDecodeError: 'ascii' codec can't decode byte Oxff in position 0: 
ordinal not in range (128) 
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UnicodeTranslateError 

Provoquee lors d'une erreur de traduction de chaine de type Unicode. 

ValueError 

Provoquee lorsqu'une operation, methode ou fonction recoit un parametre du bon 
type mais dont la valeur nest pas utilisable par le code. 

Incompatibility de valeurs 

>» from pickle import Pickler 

>» pickler = Pickle r ('/home/tziade/file' , protocol=l) 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "/usr/lib/python2 .4/pickle.py" , line 199, in init 

raise ValueError, "can't specify both 'protocol' and 'bin'" 
ValueError: can't specify both 'protocol' and 'bin' 

Dans l'exemple, le code de la classe Pickle s' assure que deux options incompatibles 
n'ont pas ete appelees en meme temps. 

WindowsError 

Provoquee pour toutes les erreurs OSError specifiques a MS-Windows qui n'ont pas 
d'equivalent dans la table des erreurs errno. Les valeurs errno et strerror sont recu- 
perees dans ce cas par le biais des API systeme GetLastErrorO et FormatMessageO 
specifiques a cette plate-forme. N'est definie et accessible dans les primitives que sur 
la plate-forme MS-Windows. 

ZeroDivisionError 

Provoquee lorsque le diviseur d'une division ou d'un modulo est zero. 

Avertissements 

Void l'ensemble des classes d'exceptions utilisees comme avertissements. Ces classes 
ne sont jamais directement appelees avec une directive rai se mais utilisees avec la 
fonction warn du module warnings. 
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Exemple d'utilisation d'un avertissement 



>» def function(): 

import warnings 
... warnings. warn('cette fonction disparaitra dans la prochaine 
version', DeprecationWarning) 
... printC resultat') 

>» function() 

/etc/pythonrc.py :2 : DeprecationWarning: cette fonction disparaitra dans 

la prochaine version 

resultat 



UserWarning 

Classe de base pour tous les avertissements. La fonction warn verifie que le type de 
l'exception qui lui est fournie derive bien de cette classe. 

DeprecationWarning 

Avertit le developpeur que la fonction ou methode executee est une relique et ne doit 
plus etre utilisee. 

FutureWarning 

Avertissement sur du code qui sera remis en cause dans le futur (voir module 
future ). 

OverflowWarning 

Avertissement pour les depassements numeriques. 

PendingDeprecationWarning 

Avertit le developpeur que la fonction ou methode executee est vouee a disparaitre et 
n'est conservee que pour assurer une compatibilite avec le code existant et une migra- 
tion douce. Le message fournit en general le nom de la fonction ou methode qui doit 
etre utilisee a la place. 

La distinction entre cet avertissement et le precedent est relativement floue. II est 
frequent que les developpeurs utilisent des avertissements de type 
DeprecationWarning en lieu et place d'avertissements de type 
Pendi ngDeprecati onWarni ng. 
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RuntimeWarning 

Avertissement sur un comportement d'execution douteux. 

SyntaxWarning 

Avertissement sur une syntaxe douteuse. 



En un mot... 



Les primitives du langage sont les fonctionnalites les plus importantes a maitriser et a 
retenir car elles fournissent toutes les manipulations de base des objets. 
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Conventions de codage 



■ Readability counts ». Tim Peters, The Zen of Python 

« La lisibilite est essentielle » 

— Tim Peters, « Le Zen de Python » 



Avant de presenter les principaux modules et de se plonger dans les exercices, il est 
necessaire d'aborder un dernier theme : les conventions de codage, ou style guide. 

Adopter des conventions pour l'ecriture du code est indispensable pour assurer la 
bonne homogeneite d'un projet, surtout lorsque plusieurs developpeurs travaillent 
sur les memes portions de code. Ce chapitre est un guide qui fournit les recomman- 
dations les plus communement adoptees. II presente dans un premier temps la mise 
en page du code, puis les conventions de nommage et la structure d'un module. La 
derniere partie propose des bonnes pratiques pour le choix des noms. 
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Mise en page du code 



Indentation 



Nous avons vu au chapitre 4 que l'une des originalites du langage Python est de 
rendre obligatoire l'indentation du code dans les structures algorithmiques. En cas de 
non-respect de cette regie, la sanction est immediate : 

Non-respect de l'indentation 

>» for i in range (2): 
. . . print(str(i)) 
File "<stdin>", line 2 
print str(i) 

A 

IndentationError : expected an indented block 
>» for i in range (2): 
print(str(i)) 



1 

Cette regie, souvent vecue comme une contrainte par les developpeurs qui decou- 
vrent le langage, s'avere etre agreable a l'usage : l'indentation etant 1' element structu- 
rant du code, celui-ci se trouve allege des accolades et autres begi n . . . end qui parse- 
ment les autres langages. 

Le nombre d'espaces ou de tabulations qui constituent l'indentation est libre, la seule 
obligation etant de ne pas melanger les deux. Le premier reflexe est d'utiliser la 
touche Tab pour minimiser le nombre de frappes, mais les espaces sont en general 
preferes pour la bonne et simple raison que le code obtenu conservera la meme allure 
d'un editeur de code a l'autre. 

La recommandation est d'utiliser quatre espaces par niveau d'indentation. II est done 
conseille d'utiliser un editeur de texte qui remplace automatiquement les tabulations 
par des espaces pour faciliter la frappe. 



Taille maximum d'unc ligne 

La taille maximum d'une ligne de code doit etre de 79 caracteres. Cette raison est 
historique puisque les ecrans en mode texte, avant l'avenement des modes graphi- 
ques, etaient en general de 80 caracteres de large. 
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Sur le materiel actuel, les developpeurs qui travaillent avec des editeurs comme 
Emacs ou Vim alignent generalement deux terminaux. 

Cette taille limite de 80 caracteres reste de toute maniere un standard immuable et 
defini par defaut dans la plupart des editeurs Python. 

Pour les lignes depassant la limite, il est necessaire d'utiliser : 

• un saut de ligne dans une sequence d'elements entre parentheses, accolades ou 
crochets ; 

• des antislash (\) ou des parentheses supplementaires; 
puis d'indenter correctement le code passe a la ligne. 

Exemples de passage a la ligne 

def _layout_modified(self, REQUEST, RESPONSE, type_id, 
1 ayout_i ndex=l , i s_f 1 exi bl e=Fal se) : 
"""Modifie le layout a la volee.""" 

if layout_index == 1 and i s_fl exi bl e and self. step == 12 and \ 
type_id != 4: 
self ._modify(type_id) 
el if layout_index == 1 and is_flexible and (self. step == 13 

«» and type_id = 3): 
self ._modifyAll (type_id) 
else: 

self._modifyAll(13) 



A SAVOIR Editeurs Python 

Les editeurs qui gerent Python proposent parfois une gestion automatique du passage a la ligne. 



Commentaires 



La bonne quantite de commentaires est en general assez difficile a trouver et depend 
de plusieurs facteurs : 

• la personnalite du developpeur ; 

• la nature du code ; 

• le rythme du projet. 

Le developpeur qui entame un projet est toujours plus bavard dans ses commentaires 
que celui qui essaye de terminer dans les temps. 

Enfin, 1'utilisation de plus en plus frequente des doctests, decrits au chapitre 12, qui 
donnent directement des exemples d'utilisation du code, reduit considerablement le 
besoin de certains types de commentaires. 
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Commentaires simples 

Les commentaires simples sont des lignes inserees dans la continuite du code et 
constituant des phrases completes. Le point de fin de phrase est retire. 

Commentaires simples 

# Preparation des donnees du XF4 et normalisation 

datas = get_datas(2) 

normal ized_datas = normal ize_xf 4 (datas) 



Commentaires en fin de ligne 

Les commentaires en fin de ligne sont distants d'au moins deux espaces de la fin du 
code et commencent par un caractere diese (#) suivi d'un espace. lis sont en general 
tres courts et doivent avoir une valeur ajoutee, c'est-a-dire ne pas se contenter de 
repeter en francais ce que le code de la ligne fait. 

lis sont preferes aux commentaires simples pour des remarques concernant l'imple- 
mentation. 

Utilisation d'un commentaire en ligne 

resultat = resultat .stripO # des espaces en trop alterent la lisibilite 

# a eviter: 

resultat = resultat * 2 # le resultat est multiplie par deux 



Blocs de commentaires 

Un bloc de commentaires est en general utilise pour expliquer le fonctionnement et 
l'objectif de la portion de code. Si le texte est constitue de plusieurs paragraphes, une 
ligne de commentaire vide les separe. Un saut de ligne est insere avant et parfois 
apres le bloc lorsqu'il est necessaire d'accentuer l'importance de ce commentaire. 

Exemple d'utilisation d'un bloc 
if kw.has_key('autolayout') : 

# Mise en place d'un affichage auto 

# pour 1 'instant sur trois colonnes 
# 

# Pourra etre plus perfectionne 

# par la suite. 
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layoutdef = {'ncols': 1, 'rows': []} 

rows = [] 

for item in layout .objectldsO : 

element = {} 

element['widget_id'] = item[3:] # retrait du prefixe "w " 

element['ncols'] = 1 

rows . append ( [el ement] ) 

layoutdef [' rows'] = rows 

# appel au moteur de rendu 

1 ayout . set_l ayout_def i ni ti on (1 ayoutdef ) 

Les blocs servent aussi comme en-tetes des modules pour inserer les informations de 
licence, de copyright et autres elements specifiques et communs a tous les fichiers du 
projet, comme nous le verrons dans la structure d'un module en fin de chapitre. 

Enfin, les notes de developpement sont souvent des commentaires avec un prefixe 
particulier (FIXME : , TODO : ou XXX : ). 

Commentaire de developpement 

def afficher(self , taille): 
""" affichage """ 

# FIXME: A quoi sert cette variable ? 
i = 12 

for u in range (taille) : 
print str(u) 



BONS USAGES Soigner les commentaires 

Un soin tout particulier doit etre apporte aux commentaires pour la valorisation a long terme du code. 
Lors d'etapes de refactoring ou d 'outsourcing, qui peuvent survenir des mois, voire des annees apres la 
creation initiale, les modules peu ou mal commentes sont en general tres rapidement jetes aux oubliettes. 



Documentation strings ou docstrings 

II est recommande de fournir un docstring pour tous les elements de code, exceptes 
les methodes privees. La raison est que l'interpreteur Python lit ces docstrings et les 

associe pour chaque element commente a un attribut special doc . Cet attribut est 

utilise dans certains cas lors d'interactions entre l'utilisateur et le programme et 
devient parfois obligatoire. Par exemple, dans une application Zope 2, une methode 
d'une classe sans docstring ne pourra pas etre appelee par le biais de l'interface web. 



Elements du langage 

Deuxieme partie 



De la meme maniere, tous les logiciels de creation automatique de documentation de 
code se basent sur cette fonctionnalite. 

Les docstrings peuvent etre ecrits sur une seule ligne ou sur plusieurs lignes et sont 
entoures de triples guillemets, et suivis d'un saut de ligne : 

Exemple de docstring 

def mi metype_to_i con (mi metype) : 

"""Transforme un type mime en nom de fichier icone.""" 
if mimetype. strip() == ' ' : 

return ' unknown .png' 
return mimetype. replace ('/' , '_') + '.png' 

Lorsqu'il est necessaire d'ecrire un texte un peu plus elabore, il est en general con- 
seille de commencer le docstring par un resume du texte, puis de laisser un saut de 
ligne entre ce titre et le corps du texte : 

Exemple de docstring sur plusieurs lignes 

def mi metype_to_i con (mi metype) : 

"""Transforme un type mime en nom de fichier icone. 

Utilise pour les fichiers attaches. Si le type 
est inconnu, renvoi e ' unknown. png' . 

mimetype = mimetype. stripO 

if mimetype == ' ' or mimetype notin kown_types: 

return ' unknown .png' 
return mimetype. replace('/' , '_') + '.png' 

Le corps du texte est aligne sur les triples guillemets et une ligne entiere est reservee 
au triple guillemet final. 



A SAVOIR Docstring sur plusieurs lignes 

Cette structure permet aux outils de documentation de differencier le titre, comparable a un docstring 
sur une seule ligne, des informations complementaires. Si elle n'est pas respectee, les documentations 
generees ne seront pas tres claires. 



Espacement du code 

Les sauts de lignes sont un facteur de lisibilite du code non negligeable. lis doivent 
done etre utilises a bon escient et combines aux commentaires pour mettre en valeur 
la structure du code. Dans les algorithmes complexes, un saut de ligne judicieuse- 
ment place avant et apres une boucle permet de mieux suivre le rythme, comme le 
fait la ponctuation dans une phrase. 
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Exemple et contre-exemple 

# code necessitant un effort de lecture supplemental re 
def reverse_text(text) : 

size = 1 en (text) 

result = [] 

for i in range(size) . reverseO : 

result. append (text [i]) 
return ' ' . join(result) 

# code mettant en relief le rythme de l'algorithme 
def reverse_text(text) : 

"""Fonction qui renvoie un texte a l'envers.""" 
size = 1 en (text) 
result = [] 

for i in range(size) . reverseO : 
result. append (text [i]) 

return ' ' . join(result) 



A RETENIR Ligne vide en fin de f ichier 

Les fichiers Python doivent toujours se terminer par une ligne vide, pour eviter d'eventuels problemes 
avec certains outils de lecture de source. 

La commande cat de certains shells Unix n'affiche jamais la derniere ligne d'un fichier par exemple. Les 
systemes de version CVS ou Subversion affichent en general un avertissement dans ce cas de figure. 



Espaces dans les expressions et definitions 

Les espaces dans les expressions et definitions doivent respecter un certain nombre 
de regies : 

1 toujours placer un espace apres une virgule, un point-virgule ou deux-points ; 

2 ne jamais placer d'espace avant une virgule, un point-virgule ou deux-points ; 

3 toujours placer un espace de chaque cote d'un operateur, sauf lorsque cet operateur 
est le signe egal (=) utilise dans l'affectation par defaut dans une liste d'arguments ; 

4 ne pas placer d'espace apres une accolade, un crochet ou une parenthese ouvrante ; 

5 ne pas placer d'espace entre le nom d'une fonction et sa liste d'arguments, ou le 
nom d'un dictionnaire et un index. 
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Exemples et contre-exemples d'espacement 

# Regie 1 

# a eviter : 

def foo(paraml , param2 ,param3): 

# preferer : 

def foo(paraml, param2, param3) : 



# Regie 2 

# a eviter : 

def foo(paraml, param2, param3 = 2): 
if a=b or c=d: 

# preferer : 

def foo(paraml, param2, param3=2) : 
ifa=borc=d: 



# Regie 3 

# a eviter : 
dictionnary 

# preferer : 
dictionnary 



{ 'key' : 1 } 
{'key' : 1} 



# Regie 4 

# a eviter : 

self. method (3, 'a') 
dictionnary ['key'] = 12 

# preferer : 
self.method(3, 'a') 
dictionnary[' key '] = 12 



Conventions de nommage 



Les conventions de nommage des differents elements de code sont aussi importantes que 
la mise en page vue dans la partie precedente, car elles donnent des informations supple- 
mentaires aux developpeurs quant a la nature de certains attributs ou certaines variables. 

Les conventions de nommage sont les conventions qui different le plus. Elles sont 
souvent inherentes a certains frameworks. Ces outils tiers imposent leur propre style, 
et il est en general conseille, lorsque Ton travaille avec un environnement base sur ces 
outils, de respecter leurs conventions. 
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Avant de presenter les differentes conventions, void quelques definitions : 

• CapitalizedWords : nom compose dun ou plusieurs mots attaches dont chaque 
premiere lettre est en majuscules ; 

• mixedCase : CapitalizedWords dont la premiere lettre est en minuscules ; 

• lowercase : nom compose d'un ou plusieurs mots attaches dont toutes les lettres 
sont en minuscules ; 

• lowercase_words : nom compose d'un ou plusieurs mots separes par des espaces 
soulignes, dont toutes les lettres sont en minuscules ; 

• UPPERCASE_WOKDS : nom compose d'un ou plusieurs mots separes par des 
espaces soulignes, dont toutes les lettres sont en majuscules. 

Ces differentes ecritures peuvent etres appliquees a trois families de noms : 

• les modules ; 

• les classes ; 

• les fonctions et variables globales d'un module, les methodes et attributs d'une 
classe. 



Modules 



Les modules doivent etres ecrits en lowercase. II faut cependant veiller a ne pas utiliser 
des noms de plus de huit caracteres pour eviter par exemple, que votre code qui fonc- 
tionne parfaitement sous GNU/Linux, ne marche plus sous certaines versions de 
MS-DOS a cause de problemes d'importation. 

La recommandation precedente etait de nommer les modules de deux manieres dif- 
ferentes suivant leur appartenance a une des deux sous-families de modules : 

• les bibliotheques ; 

• les modules de classe. 

Les bibliotheques sont des modules contenant un certain nombre de fonctions et de 
classes. C'est le cas par exemple d'i map! i b, de smtpl i b, ou encore de gzi p. 

Les modules de classe sont des modules qui ne contiennent qu'une seule classe et 
quelques elements supplementaires comme des definitions de constantes. Le module 
porte en general le meme nom que la classe qu'il contient et utilise une notation 

CapitalizedWords. 

II est preconise aujourd'hui, outre le fait d'abandonner la notation CapitalizedWords, de 
ne plus creer un module par classe mais de preferer un regroupement logique des classes, 
a differencier du regroupement fonctionnel propose par les modules de type bibliothe- 
ques. Ce regroupement est en general defini par les relations entres classes : une classe de 
base et ses classes derivees, les classes en charge du meme lot de fonctionnalites, etc. 
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Cette organisation simplifie grandement l'ecriture et la comprehension des clauses 
d'importation, qui ont tendance a representer un nombre consequent de lignes quand 
le code grossit. Par exemple, toute les classes d'un objet concernant les connexions vers 
des bases de donnees peuvent etre regroupees dans un module nomme bdaccess. 



A RETENIR Les parties privees, protegees et publiques d'une classe en Python 

Avant de presenter les conventions de nommage pour les classes, il est necessaire de faire un rapide 
resume des differents niveaux de visibility des methodes et attributs d'une classe. 
Contrairement a la plupart des langages objet, le langage Python ne definit pas de sections privees, pro- 
tegees ou publiques. 

Ces distinctions sont laissees a la charge du developpeur qui doit utiliser une convention particuliere qui 
consiste a prefixer d'un espace souligne le nom des methodes et des attributs proteges, et de deux espa- 
ces soulignes ceux destines a etre prives. 
Le chapitre 14 couvre plus en detail la programmation orientee objet. 



Classes 



Les noms des classes sont toujours en CapitalizedWords, et prefixes si necessaire d'un ou 
deux espaces soulignes. Le choix d'un nom de classe doit etre le plus descriptif possible 
et si possible avoir une racine commune au nom de la classe parente s'il y a heritage. 



B.A.-BA Nommage de classes 

Prenons I'exemple d'un ensemble de classes destinees a gerer des flux de donnees. Une classe de base 
definit une certaine abstraction du fonctionnement des flux et une classe derivee implements cette abs- 
traction pour des flux RSS. Les noms pourraient etre : 

• BaseDataStream 

• RSSDataStream 



Fonctions et variables globales d'un module, methodes et attributs 
d'une classe 

Les fonctions et variables globales d'un module sont en lowercase_iuords, et prefixees 
si necessaire d'un espace souligne. De meme, les methodes et attributs d'une classe 
doivent etre en lowercase_iuords, et prefixes si necessaire d'un ou deux espaces souli- 
gnes. Cette convention prevaut dans la plupart des cas, mais certains frameworks 
comme Zope preconisent une autre convention pour le nommage des methodes, qui 
a tendance a etre de plus en plus pratiquee : le mixedCase. 
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Constantes 



Les constantes sont, comme dans la plupart des langages, en 
UPPERCASE_WOKDS, prefixees si necessaire par un ou deux espaces soulignes. 



Structure d'un module 

Un module respecte toujours la meme organisation, soit 

• un en-tete ; 

• des clauses d'importations ; 

• des variables globales ; 

• des fonctions et classes. 



En-tete 



L'en-tete est compose d'un bloc de commentaires commun a tous les modules d'un 
projet, avec quelques elements specifiques : 

• l'interpreteur ; 

• l'encodage ; 

• la balise Id CVS ou SVN, appelee tag. 

Interpreter 

Pour les plates-formes Unices, il est de coutume de commencer ce bloc par une ligne 
indiquant au systeme l'endroit ou se trouve l'interpreteur python. 

Directive 

I #!/usr/bin/python 

Cette ligne permet d'executer directement le module en ligne de commande. Elle s'avere 
inutile pour les modules qui ne sont pas executes directement, mais nest pas genante. 

Encodage 

Les modules Python etant charges par defaut en ASCII par l'interpreteur, les carac- 
teres specifiques depassant les 128 premiers signes posent des problemes lorsqu'il est 
necessaire d'ecrire des chaines Unicode. Jusqu'a la version 2.2 de Python, l'ecriture de 
ces caracteres n'etait possible qu'en utilisant leurs equivalents en unicode-escape, ou 
par exemple e s'ecrit \xe9. 
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Python 2.3 a introduit une nouvelle directive a placer en premiere ou deuxieme ligne 
du fichier, qui permet de specifier l'encoding. L'encodage en general utilise par les 
programmeurs francophones est l'utf-8. 

Directive d'encodage 

I # --•'- encoding: utf8 -*- 



A SAVOIR Encodage d'un fichier Python 

Les editeurs de code Python recherchent generalement cette ligne pour determiner l'encodage du fichier, 
s'il differe de celui du systeme. 



Copyright et licence 

Les lignes suivantes peuvent concerner le copyright, ainsi que la licence du fichier. 
La structure de ces informations est libre. 

Tags 

Si vous utilisez CVS ou SVN (Subversion), la derniere ligne du commentaire peut 
etre utilisee pour mettre en place un tag de version, utilise par le systeme de version- 
ning pour placer un certain nombre d'informations. 

Tag vierge 
I # $Id: $ 

Ce tag sera renseigne lors du premier commit. 

Tag apres commit 

I # $Id: test_mai"lmessageeditview.py,v 1.2 2005/02/09 10:44:06 tziade Exp $ 

Docstring de module 

Le docstring general au module vient se placer juste apres le bloc de commentaire et 
contient un descriptif complet de tous les elements et de leur utilisation. II peut aussi 
contenir des informations relatives aux dependances, c'est-a-dire a l'ensemble des 
programmes et modules tiers necessaires. En outre, si le module est directement exe- 
cutable, on retrouvera dans ce docstring la liste des parametres d'execution. 
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Variables globales specifiques 

Un ensemble de variables globales specifiques peut suivre le bloc de commentaire. 
Toutes ces variables sont optionnelles et en general preconisees par des outils tiers de 
generation automatique de documentation, la reference etant celles utilisees par le 
module pydoc. 

Les variables utilisees par pydoc 



_author = "Tarek Ziade <tarek@ziade.org>' 

_date = "26 February 2005" 

_version = "SRevision: 1.5 $" 

_cred"its = """Thanks to my mother.""" 



Clauses d' importations 

Chaque clause d'importation doit etre sur une ligne distincte, en evitant de reunir plu- 
sieurs clauses sur la meme ligne, sauf lorsque les elements importes appartiennent au 
meme module. Pour ce dernier cas, une ecriture explicite est tout de meme preferable. 

Cette notation facilite la lecture, surtout lorsque les clauses d'importation sont nom- 
breuses. 

Exemples et contre-exemples 



# ecriture incorrecte : 
import smtplib, imaplib 

# ecriture correcte : 
import smtplib 
import imaplib 

# plusieurs elements du meme module, souvent utilise 
from smtplib import SMTP, SMTP_P0RT 

# plusieurs elements du meme module, preferable : 
from smtplib import SMTP 

from smtplib import SMTP_P0RT 



Les jokers 

Comme vu au chapitre 4, Python permet de faire des importations avec des jokers 
pour avoir acces a l'ensemble des fonctions, classes et methodes d'un module, dans 
votre espace de noms. 
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Importation de I'ensemble des elements d'un module 
from smtplib import * 

Cette ecriture est a proscrire sauf cas particuliers car les elements utilises ne sont pas 
clairement identifies et entrainent une perte de visibilite des dependances entre 
modules. Preferez une ecriture complete vers l'element utilise. 

Importations explicites 

# acces a une classe du module : 
from smtplib import SMTP 

# acces au module complet 

# SMTP sera atteint par smtplib. SMTP 
import smtplib 

Organisation des clauses 

Les clauses d'importation doivent etre regroupees par niveaux separes par un saut de 
ligne, le plus bas niveau etant place en premier : 

1 importations d'elements des bibliotheques standards ; 

2 importations d'elements de bibliotheques utilitaires ; 

3 importations specifiques au projet. 

Exemple 

import os 
import sys 

from smtplib import SMTP 
from smtplib import SMTP_PORT 
from imaplib import IMAP4 

from MonProjet .MonModulel import MaClasseA 
from MonProjet .MonModule2 import MaClasseB 
from MonProjet .MonModule2 import MaClasseC 

Si les niveaux ne contiennent qu'une seule clause, ils peuvent etre regroupes. 
Exemple 2 

import os 

from smtplib import SMTP 

from MonProjet .MonModule2 import MaClasseB 
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Variables globales 

Les variables globales suivent les clauses d'importation et peuvent etre reunies par 
themes separes par un saut de ligne. 

Exemple 

TIMEOUT = 12 
SLEEP = 2 

DEFAULT_SERVER = 'local host' 
DEFAULT_PORT = 25 



Fonctions et classes, le corps du module 

Le reste du module est bien sur reserve aux differentes fonctions et classes qui le 
composent. L'ordre de ces elements est en general guide par la logique des 
interactions : une classe de base est toujours placee au dessus de ses classes heritees. 
De la meme maniere, une fonction qui doit etre appelee pour toutes les classes d'une 
application se placera toujours juste apres cette classe. 

Organisation logique des classes et fonctions 

class BaseDataStream: 

"""Classe de base pour les flux.""" 

def read_st ream (self) : 

"""Lecture d'un flux.""" 
raise NotlmplementedError 

class RSSDataStream(BaseDataStream) : 
"""Classe pour les flux RSS.""" 

def read_stream(self) : 

"""Lecture d'un flux RSS.""" 



registerClass(RSSDataStream) 

Structuration d'une classe 

Une derniere partie importante en terme de structuration concerne l'organisation d'une 
classe. Lorsqu'une classe implements beaucoup de methodes, c'est en general une bonne 
idee de faire des regroupements logiques separes par des blocs de commentaires. 
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Structuration d'une classe 

class RPCDataStream(BaseDataStream) : 
"""Classe pour les flux RPC.""" 

def _fonction_internel(self) : 



def _fonction_interne2(self) : 



# 

# API public 

# 

def read_stream(self) : 

"""Lecture d'un flux RPC.'"" 



Cette notation permet de renforcer la visibilite lorsque les modules commencent a 
faire une certaine taille. 

Quoi qu'il en soit, des methodes ou des modules anormalement longs sont bien sou- 
vent le temoin d'une mauvaise architecture, et un eclatement est en general a envisager. 



Conseils pour le choix des noms 

Le choix des noms, que ce soit pour les classes, variables, methodes, ou tout autre 
element du code, doit etre fait en gardant a l'esprit que le programme n'est pas des- 
tine a etre lu par des ordinateurs, mais par des developpeurs ou des clients. 

L'ordinateur n'attache aucune importance aux noms choisis pour les variables, le 
developpeur en charge de la correction du module quant a lui peut vivre un veritable 
cauchemar si les variables trouvees dans le programme s'appellent toujours a, b et c. 

Regies generates 



Du sens 

Un nom doit etre porteur de sens. Hormis quelques exceptions comme le nom de 
certaines variables utilisees dans des boucles, un nom doit informer sur la nature de 
1' element qu'il designe. 
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Choix de la langue 

Python est un langage ecrit en anglais et tous ses elements sont des mots anglais. 
L'anglais etant de plus la langue universelle de l'informatique, il est vivement con- 
seille de l'adopter pour tous les noms si le contexte le permet. 

II est aussi necessaire de maitriser l'anglais utilise pour eviter des franglismes ou des 
fautes d'orthographe qui peuvent preter a confusion sur le sens des noms. 

Unicite des noms 

Une fois un nom choisi, il doit etre utilise et ecrit de la meme maniere dans tout le 
programme, dans la documentation et dans les specifications techniques. II faut 
absolument eviter d'utiliser plusieurs noms differents pour parler de la meme chose. 

La bonne longueur 

Utiliser des abreviations pour les noms n'est pas une bonne idee. Les noms trop 
courts perdent du sens et deviennent vite anonymes. Lorsque Ton recherche une 
variable nommee cpt dans le code, on risque d'etre noye sous les resultats. 

Des noms trop longs ne sont pas non plus conseilles, a l'instar des noms a rallonge 
que Ton trouve en Java. 

La bonne longueur est done un nom court mais precis, et non abrege. 

Eviter le melange domaine/technique 

Les termes techniques de Python peuvent etre : dictionnaire, dico, liste, collection, 
tuple, etc. 

Les termes du domaine peuvent etre : article, rayon, catalogue, etc. 

Pour eviter de rendre le code illisible, il ne faut jamais melanger les deux ensembles 
pour composer des noms comme : dico_article, tuple_rayon, etc. 

Regies pour chaque type 
Modules 

Le nom d'un module doit informer sur son contenu et rester homogene, lorsque le 
cas se presente, aux autres modules du meme paquet ou du meme theme. 

Un module de client sftp s'appellera logiquement sftplib, en continuite avec 
ftplib, httplib, imaplib, etc. 
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Classes 

Le nom d'une classe doit toujours indiquer ses objectifs et parfois ses origines. 

Sans documentation supplementaire, il doit etre possible de savoir ce que fait la 
classe, uniquement par son nom. 

Le nom d'une classe doit s'inscrire dans une certaine continuite avec les classes du 
meme ensemble. 

Dans un framework complet, cette regie peut s'etendre a l'utilisation de racines com- 
munes dans le nom de la classe, indiquant par exemple le niveau de derivation et 
l'appartenance a une famille de classes, c'est-a-dire l'origine. 

Les racines communes sont toujours a droite du nom et le prefixe est modifie ou 
enrichi dans les classes derivees. 

Par exemple : 

• StreamRequestHandler 

• BaseHTTPRequestHandler 

• SimpleHTTPRequestHandler 

Ces trois classes utilisent un tronc commun RequestHandler, puis se specialisent en 
Stream, BaseHTTP et enfin SimpleHTTP. 

D'une maniere plus generale, si un bon nom ne peut pas etre trouve pour une classe, il 
y a certainement un probleme d'analyse et les abstractions sont probablement a revoir. 

Methodes et fonctions 

Tous les conseils presentes ci-dessous s'appliquent egalement aux fonctions. 
Les methodes doivent indiquer ce qu'elles font ou ce qu'elles retournent. 
On peut separer quelques types de methodes : 

• Les booleens : il est bon de prefixer les methodes qui renvoient un booleen par 
has ou i s . 

• Les get et set : ces methodes ont comme objectif de retourner ou de modifier une 
valeur donnee. Elles sont toujours prefixees, comme leur nom l'indique, de set et 
get, suivi du nom de la valeur. 

• Les actions : meme principe que get et set mais plus general. Toutes les metho- 
des qui font quelque chose commencent par un verbe court, suivi d'un nom. 
Exemples : add_alias(), remove_codecQ, etc. 
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Variables 

Les variables doivent informer sur la valeur. Lorsque ces variables sont des collec- 
tions de valeurs, une forme plurielle doit etre utilisee. 

Les variables booleennes doivent etre prefixees par has ou i s. 



En un mot... 



Un guide de recommandations a comme unique objectif de rendre homogene 
l'ensemble du code source d'un projet. II est issu de pratiques eprouvees. II est neces- 
saire d'adopter les conventions decrites dans ce guide pour les projets publics, a savoir 
les projets ouverts dont les licences permettent a des developpeurs externes a l'orga- 
nisation de modifier le code. 

Le prochain chapitre est le premier d'une serie de trois chapitres consacres aux 
modules les plus importants de la bibliotheque standard. 



Troisieme partie 



La bibliotheque 
standard 

Un des souhaits principaux de Guido van Rossum etait de faire de Python un outil 
complet, apte a repondre aux besoins communs de programmation. Cette philosophic, 
appelee batteries included, est a l'origine de la richesse de la bibliotheque standard. 

La majorite des programmes ecrits en Python peuvent la plupart du temps etre 
concus sans avoir a rechercher des fonctionnalites supplementaires dans des librai- 
ries tierces, meme si certains domaines sont volontairement ecartes et simplement 
couverts par des abstractions, comme les connecteurs aux bases de donnees. 

La clarte et l'efficacite des API de la bibliotheque standard jouent aussi un role 
important dans la simplicite de programmation et participent au succes du langage. 
Un module d'extension prend toujours en modele les modules existants, pour etre le 
plus pythonique possible. 

Cette troisieme partie regroupe trois chapitres qui presentent une selection de 
modules de la bibliotheque standard, agrementes de nombreux exemples et 
regroupes par themes, a savoir : 

• interaction avec l'interpreteur ; 

• acces au systeme ; 

• utilitaires fichiers ; 

• outils de compression ; 

• programmation reseau ; 

• persistance ; 

• conversion, transformation de donnees ; 
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• calculs numeriques ; 

• structures de donnees ; 

• utilitaires divers. 

L'objectif de cette partie est simple : avant de se plonger dans la conception d'un 
nouveau module d'extension, une petite verification de l'existant dans les modules de 
la bibliotheque standard peut eviter de tomber dans le syndrome du Not Invented 
Here, ou Reinvention de la roue, tees frequent dans le monde de 1'OpenSource. 

Le dernier chapitre regroupe une serie d'exercices de mise en pratique de Python 
dans des conditions plus realistes que les exemples egraines dans les premieres parties 
du livre. 



8 



Principaux modules 



La philosophic de Python est de proposer un langage batteries included, c'est-a-dire 
de fournir, de base, toutes les fonctionnalites utiles au developpeur. Ce chapitre pre- 
sente une selection de modules de la bibliotheque standard, susceptibles de repondre 
aux besoins de programmation les plus courants. 

Les modules presentes sont regroupes en cinq themes. Chaque module est resume et 
presente avec une liste de ses fonctionnalites les plus importantes, accompagnee 
d'exemples d'utilisation ou de liens vers les exercices du chapitre 11, et quelques fois 
de liens vers des modules annexes. 

Les themes sont : 

• interaction avec l'interpreteur ; 

• acces au systeme ; 

• utilitaires fichiers ; 

• outils de compression ; 

• programmation reseau. 



- La bibliotheque standard 

Troisieme partie 

Interaction avec I'interpreteur 

sys 

Le module sys contient la plupart des informations relatives a 1' execution en cours, 
mises a jour par I'interpreteur, ainsi qu'une serie de fonctions et d'objets de bas 
niveau. 

argv 

argv contient la liste des parametres d'execution d'un script. Le premier element de 
la liste est le nom du script et est suivi de la liste des parametres. 

executable 

Renvoie le chemin de I'interpreteur Python. 

exc_infoO->infos 

Donne des informations sur l'exception en cours, soit le type d'exception, l'instance 
de l'exception, et l'objet traceback. 

Informations sur l'exception en cours 

>» import sys 
>» try: 

3/0 
. . . except : 

... print(sys.exc_"infoO) 

(<ciass exceptions. ZeroDivisionError at 0xb7c5balc>, 
<exceptions.ZeroDivisionError instance at 0xb7c2b2ec>, <traceback 
object at 0xb7c227ac>) 

exitO 

Quitte I'interpreteur en levant une exception SystemError. Prend en parametre un 
entier qui sera utilise comme code de retour fourni au systeme en suivant la norme : 

• si le programme a fonctionne correctement. 

• > en cas d'erreur. 

Si un autre type d'objet est fourni, il est affiche et I'interpreteur utilise comme code 
de retour. Voir l'exception SystemError du chapitre 7 pour plus d'informations. 
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modules 



Dictionnaire contenant l'ensemble des modules charges par l'interpreteur par le biais 
de directives d'importation. Lorsqu'un module est importe, l'interpreteur se refere a 
ce dictionnaire pour ne pas recharger le module s'il est deja present dans la liste des 
cles. Ce dictionnaire peut etre manipule a la volee dans un programme. 

Modifier modules peut etre relativement pratique dans le cadre de tests unitaires 
pour remplacer un module deja charge par une autre version de ce module, speciale- 
ment code pour les tests. 

Iast_type, last value, last traceback 

Disponibles uniquement dans le prompt interactif, ces trois objets donnent des 
informations sur la derniere exception non interceptee, levee par l'interpreteur. 

Informations sur la derniere exception 

>» import sys 

>» 3 / 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
ZeroDivisionError: integer division or modulo by zero 
>» sys.last_type 

<class exceptions. ZeroDivisionError at 0xb7c5balc> 
>» sys.last_value 

<exceptions. ZeroDivisionError instance at 0xb7c2bb8c> 
>» sys.last_traceback 
<traceback object at 0xb7c2albc> 

path 

Liste contenant tous les repertoires dans lesquels l'interpreteur recherche des modules 
lorsque la directive import est utilisee, ou lorsque des noms de fichiers sont utilises sans 
leur chemin complet. path peut etre modifiee a la volee dans un programme. 

platform 

Informe sur le systeme d'exploitation. 
Quelle plate-forme ? 

>» import sys 

>» sys. platform 
'linux2 ' 
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sys. platform est souvent prefere a os.name car plus precis. Par exemple, sous 
Mac OS X, il permettra de differencier Mac de Linux. 

Appels sous Mac OS X 

>» import os 
>» os.name 

'posix' 

>» sys. platform 

'darwin' 

Appels sous Linux 

>» import os 
>» os.name 

'posix' 

>» sys . platform 

'linux2 ' 

stdin, stdout et stderr 

Objets fichiers pointant respectivement sur l'entree standard, la sortie standard et la 
sortie standard pour les erreurs. 

Manipulation du flux de sortie standard 

>» import sys 

>» sys. stdout 

<open file '<stdout>', mode 'w' at 0xb7c64068> 
>» sys .stdout .write("Dans quel flux j'erre") 
Dans quel flux j'erre>» 



Acces au systeme 

Ce theme reunifies modules os, subprocess et platform. 

Le module os fournit un certain nombre de fonctions de manipulations du systeme. 
II se place au-dessus de modules specifiques a une plate-forme, comme les modules 
posix ou nt, et permet de garantir une portabilite du code. 

Le module subprocess, introduit recemment, propose des fonctions alternatives de 
manipulations des processus. 

Le module os definit egalement os.path qui est un alias vers le module posixpath, 
ntpath ou macpath, en fonction de la plate-forme en cours et qui fournit des utili- 
taires de manipulation des noms de fichiers et repertoires. 



OS 
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Enfin, platform est un module qui reunit toutes les informations que le systeme 
d'exploitation a pu fournir, du type d'architecture materielle, au nom de version du 
systeme d'exploitation, en passant par le type de processeur. 



Le module os regroupe quelques 200 fonctions ou objets qui sont dans certains cas 
des alias vers des elements d'autres modules. 

On peut regrouper ces elements en quatre sous-ensembles : 

• operations sur les descripteurs de fichiers ; 

• manipulation des fichiers et repertoires ; 

• manipulation des processus ; 

• informations sur le systeme. 

Operations sur les descripteurs de fichiers 

Lorsqu'un fichier est ouvert, un numero unique est attribue au flux jusqu'a ce qu'il 
soit ferme. Ce numero est un entier et est appele descripteur du fichier. 

Le module os fournit une fonction open() qui retourne un descripteur de fichier qui 
peut ensuite etre utilise avec certaines fonctions, qui sont presentees dans cette partie. 



A SAVOIR Gestion des fichiers 

Pour des manipulations classiques sur les fichiers, il n'est pas preconise d'utiliser ces fonctions, qui sont 
plus complexes a mettre en ceuvre, mais de preferer les objets de haut niveau de type f i 1 e, generes par 
la primitive open () ou f "i 1 e () . 

Ces objets conservent le descripteur de fichier dans I'attribut f i 1 eno et implemented une partie des 
fonctions presentees ci-dessous en methodes. 



open(nom, flags, [, mode=0777]) -> fd 

Ouvre le fichier nom et renvoie un descripteur de fichier. flags definit le mode 
d'ouverture et est construit avec les constantes suivantes (associees avec des opera- 
teurs OR) : 

• CLRDONLY ; 

• 0_WR0NLY ; 

• 0_RDWR ; 

• CLAPPEND ; 

• CLCREAT ; 

• CLEXCL ; 

• 0_TRUNC. 
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II existe des constantes supplementaires specifiques a chaque plate-forme. 
Pour Windows : 

• 0_BINARY ; 

• 0_NOINHERIT ; 

• 0_SHORT_LIVED ; 

• CLTEMPORARY ; 

• 0_RANDOM ; 

• 0_SEQUENTIAL ; 

• CLTEXT. 

Pour GNU/Linux et Macintosh : 

• 0_DSYNC ; 

• 0_RSYNC ; 

• 0_SYNC ; 

• 0_NDELAY ; 

• 0_NON BLOCK ; 

• 0_NOCTTY. 

close(fd) 

Ferme le descripteur de fichier fd. Similaire a la methode close () de la classe file. 

fstat(fd) 

Renvoie le statut d'un fichier pointe par le descripteur fd. Equivalente a os.stat() 
definie dans la section suivante, qui prend pour sa part le nom du fichier. 

fsync(fd) 

Force l'ecriture du fichier sur le disque pointe par le descripteur fd. Les objets de type 
file implementent en outre la methode flush () qui vide les tampons internes. Pour 
une ecriture complete et securisee, flush () peut etre appelee juste avant fsyncC). 

ftruncate(fd, longueur) 

Tronque le fichier pointe par le descripteur f d a la taille 1 ongueu r, exprimee en octets 
(non disponible sous MS-Windows). Similaire a la methode truncateO de la classe 
file. 

Iseek(fd, position, comment) -> nouvelle position 

Deplace le curseur du descripteur de fichier a position, comment definit si le curseur 
est deplace par rapport au debut du fichier (0), a la fin (2), ou a la position courante 
(1). On retrouve cette fonction en methode seekQ des objets de type file. 
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read(fd, taille buffer) -> chafne 

Lit dans le flux pointe par le descripteur de fichiers un maximum de tai 1 1 e_buff er 
bytes, renvoyes dans un objet de type string. Similaire a la methode read() de la 
classe f i 1 e. 

write(fd, str) -> nombre d'octets ecrits 

Ecrit la chaine de l'objet string str dans le flux pointe par le descripteur fd. Similaire 
a la methode wri te () de la classe f i 1 e. 

Les operations sur les descripteurs de fichiers peuvent s'averer interessantes pour des 
implementations specifiques de lecture -ecriture de fichiers. 

Lecture-ecriture bas niveau dans le module tarfile 

class _LowLevelFile: 

"""Low-level file object. Supports reading and writing. 

It is used instead of a regular file object for streaming 
access. 



def init (self, name, mode): 

mode = { 

"r": os.CLRDONLY, 

"w": os.O_WRONLY | os.O_CREAT | os.O_TRUNC, 
} [mode] 
if hasattr(os, "0_BINARY") : 

mode |= os.O_BINARY 
self.fd = os.open(name, mode) 

def close(self) : 

os.close(self .fd) 

def read(self, size): 

return os. read (self .fd, size) 

def write(self , s) : 

os.write(self .fd, s) 

Manipulation des fichiers et repertoires 

Cette section regroupe toutes les fonctions de manipulation du systeme de fichiers. 
Certaines sont specifiques aux plates-formes Unix et Macintosh qui possedent un 
systeme de fichiers aux fonctionnalites plus poussees que celui de MS-Windows, 
comme les fonctions de creation de liens symboliques. 
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access(chemin, mode) -> booleen 

Utilise les droits courants pour controler que Faeces au chemi n est possible et auto- 
rise, mode definit le type de test et peut prendre une ou plusieurs des valeurs ci-des- 
sous, combinees avec des OR : 

• F_OK : teste l'existence du chemin. 

• R_OK : teste le droit de lecture. 

• W_OK : teste le droit d'ecriture. 

• X_OK : teste le droit d'execution. 

chdir(chemin) 

Modifie le repertoire de travail en cours par celui pointe par chemin. 

getcwd() -> repertoire de travail 

Renvoie le repertoire de travail en cours, sous la forme d'un objet stri ng . 

chroot(chemin) 

Permet de changer le repertoire root du processus courant par celui pointe par 
chemin (non disponible sous MS-Windows). 

chmod(chemin, mode) 

Modifie les droits d'acces du chemin chemi n. mode peut prendre une valeur octale ou 
une des constantes definies dans le module stat : 

• S_ISUID ; 

• S_ENFMT ou S_ISGID ; 

• S_ISVTX ; 

• S_IRWXU ; 

• S_IREAD ou S_IRUSR ; 

• S_IWRITE ou S_IWUSR ; 

• S_IEXEC ou S_IXUSR ; 

• S_IRWXG 

• S_IRGRP 

• S_IWGRP 

• S_IXGRP 

• S_IRWXO 

• S_IROTH 

• S_IWOTH 

• S_IXOTH. 
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chown(chemin, uid, gid) 

Modifie le proprietaire et le groupe du chemin chemin, avec les valeurs numeriques 
fournies dans uid et gid (non disponible sous MS-Windows). 

link(src, dst) 

Cree un lien direct nomme dst vers src (non disponible sous MS-Windows). 

listdir(chemin) -> liste de noms 

Renvoie une liste contenant le nom des fichiers et repertoires trouves dans le reper- 
toire pointe par le chemin chemi n, a l'exception des entrees « . » et « .. ». 

Une modification a ete apportee dans la version 2.3, pour les plates-formes 
MS-Windows et Unix : si le chemin fourni est un objet Unicode, la liste renvoyee 
sera composee d'objets Unicode. 

Istat(chemin) -> stat 

Identique a os.statO, mais ne suit pas les liens symboliques (non disponible sous 
MS-Windows). 

mkdir(chemin, [mode=0777]) 

Cree un repertoire de nom chemi n. Si le repertoire ne peut pas etre cree, une OSError 
est levee, mode est ignore sous MS-Windows. 

Creation de repertoire 

>» import os 

>» os .mkdi r('test') 
>» os .mkdi r('test') 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
OSError: [Errno 17] File exists: 'test' 

makedirs(chemin, [mode=0777]) 

Fonctionne comme mkdi r() mais permet de creer recursivement tous les sous-reper- 
toires eventuellement fournis dans le chemin. Si le dernier repertoire existe, une 
erreur est levee. 

Creation recursive de repertoires 

>» import os 

>» os .makedi rs('la/route/est/longue') 

>» os .makedi rs('la/route/est/courte') 
>» 
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[tziade@Tarek ~]$ Is la/ 

route/ 

[tziade@Tarek ~]$ Is la/route 

est/ 

[tziade@Tarek ~]$ Is la/route/est 

courte/longue/ 

pathconf(chemin, nom) -> entier 

Renvoie les informations de configuration systeme pour le chemin chemin. 

nom definit le type d'informations a recuperer. C'est une chaine de caracteres ou un 
entier recupere respectivement dans la liste des cles et des valeurs du dictionnaire 
os . pathconf_names. La liste fournie n'est pas exhaustive et il est possible sur certains 
systemes d'utiliser d'autres valeurs avec pathconf. 

De plus, si le systeme ne connait pas une des constantes fournies dans le dictionnaire, 
une erreur sera levee au moment de son utilisation (pathconf n'est pas disponible 
sous MS-Windows). 

Recuperation d'informations de configuration 

>» import os 

>» os.pathconf_names 

{'PC_MAX_INPUT' : 2, ' PC_VDISABLE' : 8, ' PC_SYNC_IO ' : 9, ' PC_SOCK_MAXBUF' : 

12, 'PC_NAME_MAX' : 3, ' PC_MAX_CANON ' : 1, ' PC_PRIO_IO ' : 11, 

'PC_CHOWN_RESTRICTED' :6, ' PC_ASYNC_I0' : 10, ' PC_N0_TRUNC : 7, 

'PC_FILESIZEBITS' : 13, ' PC_LINK_MAX' : 0, ' PC_PIPE_BUF' : 5, 

'PC_PATH_MAX' : 4} 

>» os.pathconf('/usr/lib/python2.4/tarfile.py' , ' PC_FILESIZEBITS') 

64 

readlink(lien) -> chemin 

Recupere le chemin pointe par un lien. Provoque une OS Error si le chemin fourni 
n'est pas un lien (non disponible sous MS-Windows). 

Recherche du fichier originel d'un lien 

$ touch fichier.py 

$ In -s fichier.py "lien.py 

$ python 

Python 2.6.1 (r261:67515, Dec 6 2008, 16:42:21) 

[GCC 4.0.1 (Apple Computer, Inc. build 5370)] on darwin 

Type "help", "copyright", "credits" or "license" for more information. 

>» import os 

>» os. readlinkC lien.py') 

'fichier.py' 
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remove(chemin) 

Supprime le fichier pointe par son chemin. Equivalente a unlink(path). Si le fichier 
ne peut pas etre retire (par exemple, lorsque le fichier est en cours d'utilisation pour 
les systemes MS-Windows) ou si le chemin pointe sur un repertoire, une erreur sys- 
teme est levee. 

removedirs(chemin) 

Supprime chemin recursivement. Commence par supprimer le repertoire le plus pro- 
fond et remonte le chemin. Si un repertoire rencontre n'est pas vide, removedi rs 
s'arrete silencieusement, sauf dans le cas du repertoire le plus profond ou une erreur 
est generee. 

rename(ancien, nouveau) 

Renomme le fichier ancien en nouveau. 

Attention : sous Unix, si un fichier nomme nouveau existe deja et si i'utilisateur a les 
droits en ecriture sur ce fichier, il sera ecrase silencieusement. En cas de probleme, 
une erreur systeme est levee. 

renames(ancien, nouveau) 

Renomme le fichier ancien en nouveau de la meme maniere que rename (). Si les 
repertoires intermediates du chemin nouveau n' existent pas, ils sont crees. Si l'opera- 
tion reussit, un appel a removedi rs() est ensuite effectue sur l'ancien chemin. 

Dans l'exemple ci-dessous, le fichier fichier.txt qui est contenu dans le repertoire 
sous_dossier, est renomme en fichier2.txt et deplace dans sous_dossier2. 
Comme ce fichier est le seul du repertoire sous_dossi er, ce dernier est supprime. 

Renommage d'arborescence 

>» import os 

>» os.listdi rC/home/tziade/testrenames') 

['sous_dossier'] 

>» os .listdi r('/home/tziade/testrenames/sous_dossier ') 

['fichier.txt'] 

>» os . renames('/home/tziade/testrenames/sous_dossier/fi chier.txt' , 

' /home/tzi ade/testrenames/sous_dossi er2/f i chi er2 . txt ' ) 
>» os.listdi r(' /home/tzi ade/testrenames') 
['sous_dossier2' ] 

>» os .listdi r(' /home/tzi ade/testrenames/sous_dossier2 ') 
['fichier2.txt'] 
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rmdir(chemin) 

Supprime le repertoire pointe par chemi n. Si le repertoire en question n'est pas vide, 
ou si ce n'est pas un repertoire, une erreur systeme est levee. 

stat(chemin) -> objet stat result 

Renvoie un objet stat_resu"lt dont les attributs contiennent des informations sur le 
chemin, a savoir : 

• st_mode : permissions ; 

• st_i no : numero d'inode ; 

• st_dev : peripherique ; 

• st_nl ink : numero de lien si lien direct ; 

• st_uid : ID du proprietaire ; 

• st_gi d : ID du groupe ; 

• st_size : taille du fichier en octets ; 

• st_atime : date de dernier acces ; 

• st_mtime : date de derniere modification ; 

• st_ctime : date de creation sous MS-Windows et date de derniere modification 
des meta-donnees sous Unix. 

Certains attributs supplementaires sont accessibles pour certaines plates-formes: 

• st_blocks : nombre de blocs alloues au fichier (GNU/Linux) ; 

• st_bl ksize : taille d'un bloc d'allocation (GNU/Linux) ; 

• st_rdev : type de peripherique pour les peripheriques inode (GNU/Linux) ; 

• st_rsize : taille reelle du fichier (Mac) ; 

• st_creator : createur du fichier (Mac) ; 

• st_type : type de fichier (Mac). 

Lorsqu'un appel a stat() est effectue, il est possible d'acceder aux resultats sous la 
forme d'un tuple qui renvoie une partie des attributs de l'objet, pour assurer une 
compatibilite avec les anciennes versions. 

Pour toutes les valeurs de temps, stat() fait appel a os.stat_float_times(). Si 
cette fonction renvoie vrai, les temps sont renvoyes en secondes dans des objets float. 
Dans le cas inverse, des secondes entieres sont renvoyees. Par defaut, 
stat_f"loat_timesO renvoie False, pour assurer une compatibilite avec les 
anciennes versions de Python, mais il est possible de modifier cette valeur en appe- 
lant stat_Float_timesO avec la valeur booleenne de renvoi souhaitee en parametre. 
Cette modification sera conservee pour tous les appels suivants du programme. 
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stat() sur socket.py 



>» import os 

>» os .statC socket .py') 

posi x . stat_resul t (st_mode=33188 , st_i no=2598207L , st_dev=234881026L , 

st_nlink=l, st_uid=501, st_gid=80, st_size=17974L, st_atime=1234532028, 

st_mtime=1232790848, st_ctime=1232790848) 

>» stats = os. stat ('socket.py') 

>» for attribut in dir(stats): 

if attn'but. startswith('st_') : 

print('%s: %s ' % (attribut, getattr(stats , attribut))) 

st_atime: 1234532028.0 
st_blksize: 4096 
st_blocks: 40 
st_ctime: 1232790848.0 
st_dev: 2 34881026 
st_flags: 
st_gen : 
st_gid: 80 
st_ino: 2598207 
st_mode: 33188 
st_mtime: 1232790848.0 
st_nlink: 1 
st_rdev: 
st_size: 17974 
st_uid: 501 

symlink(src, dst) 

Specifique a Unix, cree un lien symbolique dst, pointant vers src. 

unlink(chemin) 

Similaire a remove (chemin). 

walk(top[, topdown=True[, onerror=None]]) 

Permet de parcourir recursivement l'arborescence des repertoires, en utilisant le 
chemin top comme racine. walk() renvoie un iterateur dont chaque entree est un 
tuple compose de trois elements : 

• Le premier element est le chemin du repertoire. 

• Le second fournit la liste des sous-repertoires de ce repertoire par un appel a 
os.listdi r() . 

• Le troisieme element est la liste des fichiers. 

Sur les systemes supportant les liens symboliques, ces derniers seront affiches dans la liste 
des sous-repertoires mais les liens ne seront pas suivis pour eviter les boucles infinies. 
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L'ordre de parcours de l'arborescence est defini par le parametre topdown. Lorsqu'il 
est a True, l'arbre est parcouru de bas en haut, et chaque branche est suivie jusqu'a sa 
feuille. Si topdown est a False, l'arbre est parcouru dans l'ordre inverse et les noeuds 
enfants se presentent toujours avant leurs parents. 

Dans le cas ou topdown est a True, l'iterateur renvoye par wal k() se base sur la liste 
des sous-repertoires renvoyee dans le tuple pour un repertoire donne, pour continuer 
son parcours dans la branche. Cette liste peut etre modifiee a la volee pour influencer 
le fonctionnement de l'algorithme de parcours. 

L'exemple ci-dessous parcourt l'arborescence d'une installation Python, pour afficher 

tous les fichiers Python exceptes les fichiers init .py, en excluant a la volee les 

repertoires aux noms speciaux. 

Parcours des sources de Python 



>» for root, dirs, files in os.walk('/usr/lib/python2 . 5 ') : 
for di r in di rs: 

if (di r_.startswith('_') or 

dir_ in ('demos', 'docs', 'doc', 'test')): 
di rs . remove (di r_) 
for f in files: 

if f .endswithC .py ') and f != ' init .py': 

print(os.path . join(root , f)) 



/usr/1 
/usr/1 
/usr/1 
/usr/1 
/usr/1 
/usr/1 



b/python2 . 5/BaseHTTPServer.py 
b/python2 . 5/Basti on . py 
b/python2 . 5/CCIHTTPServer . py 
b/python2 . 5/ConfigParser.py 
b/python2 . 5/Cooki e . py 
b/python2.5/DocXMLRPCServer.py 



/usr/1 ib/python2 . 5/xml/sax/handler.py 
/usr/1 i b/python2 . 5/xml /sax/saxuti 1 s . py 
/usr/lib/python2 . 5/xml /sax/xml reader. py 

L'option onerror, lorsqu'elle est specifiee, permet d'associer une fonction a toute erreur 
systeme survenue lors du parcours des repertoires, ces erreurs etant rendues silencieuses 
par walk() par defaut. L' erreur est alors passee a la fonction, qui devient en quelque 
sorte le bloc except et peut decider de provoquer un rai se ou de laisser passer l'erreur. 

Lecture du repertoire /var/log 



>» import os 

>» def print_error(e) : 

... print("Lecture impossible %s" 



% e) 
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>» for root, dirs, files in os .walk(top='/var/log' , 

... onerror=print_error) : 

for f in files: 
... print(os. path. join(root, f)) 

/var/1 og/CDIS . custom 
/var/log/OSInstall .custom 

/var/1 og/cups/page_l og 

Lecture impossible [Errno 13] Permission denied: '/var/log/krb5kdc' 

/var/1 og/samba/1 og . nmbd 

Lecture impossible [Errno 13] Permission denied: ' /var/1 og/samba/cores' 

Manipulation des processus 

Les fonctions ci-dessous permettent de creer et de gerer des processus annexes au 
processus principal. Ce besoin peut aller du simple appel a un executable du systeme 
a des interactions plus complexes mettant en ceuvre des protocoles d'echanges de 
donnees entre processus. 

abortO -> ne retourne pas ! 

Envoie un signal SICABRT au processus en cours. Le processus stoppe immediate- 
ment son execution et renvoie un code de sortie a 3. 

Sous Unix, un fichier core dump est genere avant la sortie du processus. 

exec*([chemin|fichier], [args|argO, argl, ..., argn], [env]) 

II existe huit fonctions qui permettent d'executer un programme sous Python, avec un 
meme prefixe exec. Ces fonctions lancent l'execution d'un programme dans un pro- 
cessus qui vient remplacer le processus en cours. Lorsque le programme a acheve son 
execution, il n'y a pas de retour au processus precedent (voir dans ce cas spawn* ()) : 

execl (chemin, argO, argl, ..., argn) 

path est le chemin vers 1' executable. La serie des argx represente les parametres 
passes a l'executable, sachant que argO correspond au nom de 1' executable, de la 
meme maniere que sys .argv. Le nouveau processus recupere les variables d'environ- 
nement du processus precedent. 

execle(chemin , argO, argl, ..., argn, env) 
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Meme fonctionnement qu'execl , avec un parametre supplemental env. env est un 
mapping qui contient les variables d'environnement pour le processus. 

J! execlp(fichier, argO, argl, ..., argn) 

Meme fonctionnement qu'execl , excepte que le nom de l'executable nest pas fourni 
par un chemin mais par un nom relatif. L'interpreteur recherche alors l'executable 
dans les repertoires definis dans la variable d'environnement PATH. 

I execlpe(fichier, argO, argl, ..., argn, env) 

Meme fonctionnement qu'execl pe, excepte que l'environnement est fourni dans env, 
comme pour execle. 

I execv(chemin, args) 

Meme fonctionnement qu'execl, sauf que les arguments sont passes dans la 
sequence arg. 



execve(chemin, args, env) 

Meme fonctionnement qu'execv, avec les variables d'environnement fournies dans 
env comme pour execle. 

execvp(fichier, args) 

Meme fonctionnement qu'execv, excepte que le nom de l'executable n'est pas fourni 
par un chemin mais par un nom relatif, comme pour execl p. 

execvpe(fichier, args, env) 
Meme fonctionnement qu'execvp, les variables d'environnement en plus. 



FONCTIONS OS.EXEC* disparition programmee 

Le module subprocess a ete ajoute pour supprimer un jour les fonctions os.exec*. Sachant que 
chacune de ces fonctions a une equivalence dans subprocess, une bonne pratique est de ne plus les 
utiliser. 



Voir aussi : le module subprocess. 
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forkO -> PID 

Permet de creer un processus enfant. forkO renvoie le PID (Process ID) du nouveau 
processus dans le processus pere, et dans le processus enfant (non disponible sous 
MS-Windows). 

Le principe du forking est de creer un deuxieme processus qui continue a executer la suite 
du programme, en parallele du processus original. Le code doit done etre en mesure de 
differencier les deux processus dans la suite du programme. II peut le faire grace au retour 
de la fonction fork() , qui est differente suivant le processus ou Ton se trouve. 

Lexemple ci-dessous est un squelette possible de mise en oeuvre de fork(). 
Implementation de fork() dans un module fork.py 

# -*- coding: utf8 -*- 
import os 
import time 
import sys 
import warnings 

chilcLpid = os.forkO 

if child_pid == 0: 

# code enfant 

print('enfant : je suis le processus enfant') 
try: 

print('enfant: je travail') 

time. sleep(2) 

print("enfant: j'ai fini") 
except : 

# le code du processus enfant 

# ne doit pas generer une erreur ici 

# qui risquerait de le faire remonter 

# et de lui faire executer 

# du code prevu pour le processus parent 

lerr = '%s: %s ' % (sys.exc_info() [0] , sys.exc_info() [1]) 
warnings .warn('Erreur dans le processus enfant:\n %s' % lerr) 
else: 

# code parent 

print('pere: je suis le processus pere') 

print("pere: j 'attends le processus enfant") 

os.waitO 

print('pere: le processus enfant a termine') 

Lexecution de ce programme entrainera la creation de deux processus. 
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Execution de fork.py 

$ python fork.py 

enfant: je suns le processus enfant 

enfant: je travail 

pere: je suns le processus pere 

pere: j 'attends le processus enfant 

enfant: j'ai fini 

pere: le processus enfant a termine 

Pour sortir d'un processus enfant, il existe une fonction exit() specifique : 
os._exit(). 

Cette fonction fonctionne comme la fonction standard sys.exitO et peut etre 
appelee depuis la version 2.3 avec un code de sortie optionnel en parametre, pour les 
plates-formes non MS-Windows. Parmi les codes existants, nous trouvons : 

• EX_OK : sortie normale ; 

• EX_OSERR : erreur systeme. 



SUBPROCESS un fork portable 

Le module subprocess, introduit dans Python 2.6, et presente dans le chapitre 10, offre un systeme 
de creation et de gestion de processus portable, beaucoup plus simple qu'un appel bas niveau a 
os. fork. 



kill(PID, sig) 

Tue un processus avec un signal sig. Le module signal fournitles constantes dispo- 
nibles pour le signal et contient, entres autres : SICKILL, SIGQUIT, SICABRT (non dis- 
ponible sous MS-Windows). 

nice(inc) -> nouvelle priorite 

Reduit la priorite d'ordonnancement du processus en cours en incrementant sa valeur 
de gentillesse de la valeur inc. 

La priorite d'un processus varie de -20 (le plus prioritaire) a 19 (le moins prioritaire) 
et est fixee a par defaut. Seuls les utilisateurs root peuvent augmenter la priorite en 
fournissant des valeurs negatives (non disponible sous MS-Windows). 

popen*(cmd[, mode[, bufsize]]) 

La serie des fonctions popen() permet de lancer une commande and sur le systeme 
dans un processus enfant et d'ouvrir un tunnel de communication (un pipe) entre le 
processus courant et ce processus enfant. 
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Ce tunnel prend la forme d'un fichier ouvert dans lequel le processus peut lire les 
eventuelles donnees renvoyees par le processus enfant et ecrire des donnees si le 
mode d'ouverture mode le permet. mode est a r par defaut mais peut prendre toute les 
valeurs de mode d'ouverture de fichier. 

Enfin, bufsize determine la taille du tampon d'entree-sortie du fichier. Comme 
pour la primitive open(), bufsize peut prendre la valeur (pas de tampon), 1 
(tampon de la taille d'une ligne), n (entier superieur a 1, determinant la taille du 
tampon en caracteres). 

Lorsque le fichier est ferme par le biais de la methode closeO, le sous-processus 
renvoie le code de retour sous la forme d'un entier. S'il n'y a eu aucune erreur, 
close () renvoie None en lieu et place du code de retour 0. 

Cette fonctionnalite est disponible sous quatre formes, avec un retour different pour 
chacune d'entre elles. 

I popen(cmd[, mode[, bufsize]]) 

Renvoie un fichier ouvert vers le sous-processus. 
popen2(cmd[, mode[, bufsize]]) 

Renvoie un tuple compose de deux fichiers ouverts vers le sous-processus. Le pre- 
mier est le flux d'entree standard du processus, le second le flux de sortie. 

popen3(cmd[, mode[, bufsize]]) 

Comme popen2 mais ajoute un troisieme fichier pour le flux standard d'erreurs. 
popen4(cmd[, mode[, bufsize]]) 

Comme popen3 mais regroupe les flux de sortie et d'erreur dans le meme flux. 
L'exemple ci-dessous utilise popen() pour appeler la commande shell Is. 

Appel de Is 

>» pipe = os.popen('ls -Ih /usr/"lib/python2.4') 

>» pipe. readlineO 

'total 9,2M\n' 

>» pipe. readlineO 

'-rw-r--r-- 1 root root 33K f\xe9v 12 2005 aifc.py\n' 

>» pipe. readlineO 

'-rw-r--r-- 1 root root 28K f\xe9v 12 2005 aifc.pyc\n' 

>» pipe. readlineO 

1 -rw-r--r-- 1 root root 28K f\xe9v 12 2005 aifc.pyo\n' 
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>» pipe. read~line() 

1 -rw-r--r-- 1 root root 2,6K f\xe9v 12 2005 anydbm . py\n ' 

>» pipe.closeO 

Voir aussi : le module subprocess. 

spawn*(mode, [chemin|fichier], [args], ..., [env]) 

La serie des fonctions spawn () est basee sur le meme principe que les exec() a 
l'exception pres que le programme appele est execute dans un nouveau processus, 
mode permet de determiner si le processus principal se met en attente de fin d'execu- 
tion du processus enfant (P_WAIT) et recupere directement le code de sortie, ou s'il 
lance le processus en parallele (P_N0WAIT) et recupere le pid du processus enfant. Les 
autres parametres fonctionnent sur le meme modele d'execO, a savoir : 

• spawn! (mode, chemin, argO, argl, ..., argn) ; 

• spawnle(mode, chemin, argO, argl, ..., argn, env) ; 

• spawnlp(mode, fichier, argO, argl, ..., argn) ; 

• spawn! pe (mode, fichier, argO, argl, ..., argn, env) ; 

• spawnv(mode, chemin, args) ; 

• spawnve(mode, chemin, args, env) ; 

• spawnvp(mode, fichier, args) ; 

• spawnvpe(mode, fichier, args, env). 

Les fonctions contenant p ne sont pas disponibles sous MS-Windows. 
Voir aussi : le module subprocess. 

system(commande) -> code de retour 

Permet de lancer une commande dans un sous-shell et renvoie le code de retour de la 
commande. La sortie standard de la commande est liee a la sortie standard du pro- 
cessus principal. 

Utilisation d'os.system 

>» coderet = os.system('ls /') 

backups boot dev home lib mnt opt root service 

src sys usr 

bin command etc initrd "lost+found proc sbin srv tmp var 

>» coderet 



Le code de retour est fortement lie au type de systeme et varie d'une version a l'autre, 
car cette fonction appelle la fonction system (), cmd . exe ou encore command . com. 

Voir aussi : le module subprocess. 
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wait() -> (PID, statut) 

Attend la fin de l'execution d'un processus enfant et renvoie le PID du processus ter- 
mine ainsi que son statut de retour. 

Le statut est un entier sur 16 bits. Les 7 bits de poids faible representent le signal qui 
a tue le processus. Le 8eme bit est a 1 lorsqu'un fichier core dump a ete cree, et les 8 
bits de poids fort representent le code de sortie. 

waitpid(PID, options) -> (PID, statut) 

Meme fonctionnement que wait() mais permet d'attendre un processus enfant par- 
ticulier, en fournissant son PID. 

PID peut aussi prendre des valeurs particulieres sous Unix : 

• : attente de n'importe lequel des processus du groupe auquel appartient le pro- 
cessus courant ; 

• -1 : attente de n'importe quel enfant du processus courant ; 

• -n : pour n < -1, attente de n'importe lequel des processus du groupe de proces- 
sus n. 

Les options sont a prendre dans les constantes suivantes, qui peuvent etre associees 
avec des OR : 

• : aucune option ; 

• WNOHANG : evite un blocage si aucun statut n'est disponible. 

Informations sur le systeme 

environ -> dictionnaire 

Renvoie un dictionnaire contenant l'ensemble des variables d'environnement. Ce 
dictionnaire peut etre directement modifie. Les fonctions putenv() et getenvO sont 
alors automatiquement appelees par l'interpreteur. 

Modification de la variable TMP 

>» import os 

>» os.envi ron['TMP'] 

' /home/tzi ade/tmp ' 

>» os .envi ron['TMP'] = ' /home/tzi ade/tmp2 ' 

>» os .envi ron['TMP'] 

' /home/tzi ade/tmp2 ' 
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getloadavgO -> tuple de trois reels 

Renvoie une moyenne du nombre de processus geres par la queue d'execution du sys- 
teme les 1, 5 et 15 dernieres minutes. Correspond a l'information affichee dans 
l'ecran de la commande top sous Linux et Mac OS X. 

Appel de getloadavg 

>» import os 

>» os. getloadavgO 

(0.5380859375, 0.62841796875, 0.6630859375) 

Si cette information de charge ne peut pas etre obtenue, leve une erreur systeme. 

getuid() -> uid, getgid() -> gid et getlogin() -> login 

Recupere, pour les plates-formes Unix, le user id, group id et le login correspondant, 
pour le processus en cours. 

Lecture des informations user 

>» import os 

>» print('uid: %d, gid: %d, login: %s ' % 

... (os.getuid() , os.getgidO, os .getlogin())) 

uid: 501, gid: 501, login: tziade 

name -> type de systeme 

Renvoie le type de systeme. 

Peut prendre les valeurs suivantes : 

• posix (Unix et affilies) ; 

• nt (Windows) ; 

• mac ; 

• riscos ; 

• os2 ; 

• ce ; 

• java. 
Voir aussi : sys . pi atform. 

setuid(uid) et setgid(gid) 

Permet de specifier pour le processus en cours, l'utilisateur et le groupe. Uniquement 
pour Unix. 
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sysconf(nom) -> entier 

Renvoie une valeur de configuration du systeme. Le dictionnaire os . sysconf_names 
contient l'ensemble des noms pouvant etre utilises pour le parametre nom sur le sys- 
teme courant (non disponible sous MS-Windows). 

Recuperation du nombre de processeurs 

>» import os 

>» nbproc = os. sysconf ('SC_NPROCESSORS_CONF') 
>» print 'Nombre de processeurs: %d' % nbproc 
Nombre de processeurs: 1 

uname() -> (sysname, nodename, release, version, machine) 

Disponible uniquement pour les Unix recents, renvoie les identifiants du systeme. 

Identifiants du systeme sous Linux 

>» os.unameO 

('Linux', 'Tarek', '2 .6.11-6mdk-i686-up-4CB' , '#1 Tue Mar 22 15 : 51:40 

CET 2005' , 'i686') 



subprocess 



Ce module, introduit a la version 2.4 de Python, offre des fonctions de tres haut niveau, 
permettant de creer de nouveaux processus. L'objectif de subprocess est de remplacer a 
terme la serie des fonctions popen*() et spawn*(), et autres createurs de processus 
enfants, pour foumir une interface unifiee plus simple d'utilisation et plus souple. 

calif args, **kwargs) -> code de retour 

Lance sur le systeme une commande avec des arguments, attend que la commande 
s'acheve, et renvoie le code de retour. Equivalente a os . system (). 

class Popen 

La classe Popen encapsule un processus enfant et fournit des methodes et des attri- 
buts pour manipuler ce processus : 

• pol 1 () : verifie si le processus enfant est toujours vivant. 

• wait() : attend que le processus enfant se termine. 

• communicatees nput=None) : communique avec le processus enfant. Si input est 
fourni, il est ecrit dans l'entree standard du processus enfant. Renvoie un tuple 
(stdout , stderr) apres avoir attendu la fin du processus enfant. 
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• stdi n : attribut pointant sur l'entree standard du processus enfant. 

• stdout : comme stdi n, pour la sortie standard. 

• stderr : comme stdi n, pour la sortie d'erreur standard. 

• pi d : pi d du processus enfant. 

• returncode : code de retour du processus enfant. Si returncode vaut None, le 
processus enfant n'a pas termine. Renvoie -n sous Unix pour le code de retour n . 

La creation d'une instance de Popen peut prendre une multitude d'options : 

Popen(args, bufsize=0, executable=None, stdin=None, stdout=None, 
stderr=None, preexec_fn=None, close_fds=False, shell=False, cwd=None, 
env=None, universal_newlines=False, startupinfo=None, creationflags=0) 

args contient la commande a lancer et est sous la forme d'un objet string ou une 
sequence d'objets string en fonction du parametre shell. 

Si le parametre shell est a False, args doit etre une sequence dont le premier ele- 
ment est la commande a lancer et les suivants les parametres de la commande. Une 
string sera alors automatiquement traduite en une sequence d'un element. 

Si le parametre shel 1 est a True, la commande complete peut etre contenue dans un 
objet string. Si une sequence est passee, le premier element sera pris comme com- 
mande et les suivants comme arguments shell supplementaires. 

MS-Windows fonctionne differemment pour la lecture de la commande : si args est 
une sequence, et ce quelle que soit la valeur de shel 1 , le systeme demandera une con- 
version vers un objet string avec la methode 1 i st2cmdl i ne. 

bufsize fonctionne de la meme maniere que la primitive open() : 

• : pas de tampon ; 

• 1 : tampon ligne ; 

• n : avec n > 1, taille du tampon. 

executabl e permet de definir le programme a executer et se place en amont de args. 
Reste a None en general, ou contient le chemin vers un shell particulier. Popen utilise 
en temps normal le shell par defaut, soit /bin/sh sous Unix et celui specifie dans la 
variable d'environnement COMSPEC sous MS-Windows. 

stdin, stdout et stderr definissent les trois flux standards du processus, a savoir 
l'entree, la sortie et la sortie d'erreur. 

Peuvent prendre une des valeurs suivantes pour la redirection : 

• subprocess . PIPE : creation d'un nouveau pipe ; 

• un descripteur de fichier ; 

• un objet fichier ; 
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• None : aucune redirection. 



stderr peut aussi prendre la valeur subprocess.STDOUT. Elle est alors redirigee vers 
le flux stdout. 

Popen en action 

>» from subprocess import * 

>» pipe = Popen('ls -1 /usr/lib/python2. 5' , 

she~n=True, stdout=PIPE) . stdout 
>» pipe. readlineO 
'total 9388\n' 
>» pipe. readlineO 

'-rw-r— r— 1 root root 33330 f\xe9v 12 2005 aifc.py\n' 
>» pipe. readlineO 

'-rw-r— r— 1 root root 28568 f\xe9v 12 2005 aifc.pyc\n' 
>» pipe. readlineO 

'-rw-r— r— 1 root root 28568 f\xe9v 12 2005 ai fc . pyo\n ' 
>» pipe.closeO 



os.path 

Ce module reunit des fonctions de manipulation de noms de chemins. 

abspath(chemin) -> chemin 

Renvoie un chemin absolu en fonction du chemin relatif et du chemin de travail cou- 
rant renvoye par os .getcwd(). 

basename(chemin) -> chemin 

Renvoie le dernier element du chemin. 

commonprefix(list) -> chemin 

Retourne le prefixe le plus long, commun a tous les chemins fournis dans la liste. 

defpath -> liste de chemins 

Objet string contenant une liste de repertoires separes par des « : ». Cette liste est 
utilisee par les fonctions exec() et spawn () lorsqu'un executable est recherche et 
qu' aucune variable d'environnement PATH ha ete trouvee. Peut etre modifie. 

dirname(chemin) -> repertoire 

Renvoie le repertoire du chemin. Correspond au premier element retourne par un 
appel a split(). 
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exists(chemin) -> booleen 

Renvoie True si le chemin existe. Pour les liens symboliques, verifie aussi que le 
chemin pointe par le lien existe toujours et retourne Fal se dans le cas de liens casses. 
Une nouvelle version a ete introduite dans Python 2.4, qui fonctionne de la meme 
maniere mais qui retourne True sur les liens symboliques qui sont casses : lexists(). 
Cette version reste bien sur equivalente a exi sts() pour les systemes sans liens sym- 
boliques, comme MS-Windows. 

getsize(chemin) -> taille 

Renvoie la taille en octets du chemin. 

isfile(chemin) -> booleen 
islink(chemin) -> booleen 
isdir(chemin) -> booleen 

ismount(chemin) -> booleen 

Permet de savoir si le chemin est un fichier (isfile()), un repertoire (isdi r()), un 
point de montage (ismountO) et/ou un lien symbolique (is"linkO). islink() ren- 
voie toujours Fal se sur les systemes sans liens. 

Utilisation des API sur /tmp 

>» from os import path 

>» path. isdi r('/tmp') 

True 

>» path. isfileC /tmp') 

False 

>» path. ismountC /tmp') 

False 

»> path. ismountC/') 

True 

join(cheminl [, chemin2[, ...]]) -> chemin concatene 

Permet de concatener plusieurs parcelles de chemins en un chemin unique, en utili- 
sant le separateur du systeme conserve dans os . sep . 

Jointure 

>» import os 

>» os. path. join('home' , 'tziade', 'Documents') 
' home/tzi ade/Documents ' 



Principaux modules 

Chapitre 8 

Le code utilisant joi n() reste ainsi portable. 

split(chemin) -> (chemin, dernier element) 

Separe un chemin en deux composants, le deuxieme est le dernier element du 
chemin et le premier le reste. Si le chemin n'a aucun separateur, head est vide. 

Extraction du nom de fichier avec split 

>» import os 

>» os . path. split ('/Use rs/tarek/. vim re') 
('/Users/tarek' , '.vimrc') 



platform 



Le module pi atform reunit des informations sur le systeme hote. Seules les informa- 
tions communes a toutes les plates-formes sont presentees ici. 

architecture(executable=sys. executable, bits=", linkage=") -> (bits, linkage) 

Scanne 1' executable fourni pour recuperer des informations d'architecture. 
executabl e est par defaut le binaire de i'interpreteur Python, bi ts represente le type 
d'architecture (16, 32 ou 64 bits) et linkage le format de liaison (ELF, etc.) Si le 
fichier fourni n'est pas un executable, renvoie ( ' 32bi ts ' , ' ' ) ou les valeurs fournies 
en parametres. 

machine() -> type de machine 

Renvoie le type de machine sous forme de string, soit i686, i586... 

node() -> nom reseau 

Renvoie le nom reseau de la machine. Renvoie une chaine vide si le nom de la 
machine n'a pas pu etre obtenu. 

platform(aliased=False, terse=False) -> informations plate-forme 

Recupere et concatene des informations sur le systeme. Le resultat n'est pas destine a 
etre parse par du code car il peut varier d'un systeme a 1' autre. Si al i ased est a True, 
platformO tente d'appliquer la fonction plateform.system_alias() au triplet 
(system, release, version) s'il est trouve. system_alias() tente de trouver un 
nom commun correspondant au triplet. 

processor^) -> informations sur le processeur 

Renvoie le nom du processeur. Ce nom contient en general le nom du fondeur, le 
modele, et la frequence, en fonction de la maniere dont Python a ete compile 
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Appel sous Mac OS X, avec Python 2.6 

>» import platform 

>» platform. processor() 

'i386' 

python build(), python compiler() et python version () 

Renvoient les informations sur l'interpreteur Python, le numero et la date de build, le 
compilateur utilise, la version. 

release() -> info de release 

Renvoie le numero de release du systeme. 

system() -> nom du systeme 

Renvoie le nom du systeme. 

version () -> version de release 

Renvoie la version de release du systeme. 

unameO -> (system, node, release, version, machine, processor) 

Renvoie un tuple compose de resultats d'appels a diverses fonctions presentees dans 
cette section. Ajoute le nom du processeur, par rapport a os . uname(). 

Script d'exemple d'utilisation du module platform 

# -*- coding: utf8 
from platform import * 

system, node, release, version, machine, processor = unameO 
pbuild = python_build() 
pversion = python_version() 

print(' Systeme: %s %s (%s) ' % (system, release, version)) 
print('Architecture: %s ' % machine) 
print(' Processeur : %s' % processor) 
print('Nom reseau: %s' % node) 
print('Version Python: %s build %s (%s) ' % 
(pversion, pbuild[0], pbuild[l])) 

$ python infos.py 

Systeme: Darwin 9.6.0 (Darwin Kernel Version 9.6.0: Mon Nov 24 17:37:00 

PST 2008; root:xnu-1228.9. 59~1/RELEASE_I386) 
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Architecture: i 386 

Processeur: i386 

Norn reseau: MacZiade 

Version Python: 2.6.1 build r261:67515 (Dec 6 2008 16:42:21) 



Utilitaires fichiers 

Ce theme est un complement au theme precedent et contient trois modules 

• shuti 1 : fournit des fonctions de copie et suppression de fichiers. 

• di rcache : implemente une lecture de repertoires avec cache. 

• f i 1 cmp : offre des fonctions de comparaison de repertoires et fichiers. 



shutil 



shutil encapsule des appels au module os pour fournir des fonctionnalites de plus 
haut niveau, concernant la copie et la suppression de fichiers ou de groupes de 
fichiers. 

copy(src, dst) 

Copie le fichier de chemin src vers dst. Si dst est un fichier existant, il est ecrase. Si 
dst est un repertoire, la fonction copie le fichier dans ce repertoire. copyO recopie 
les donnees mais egalement les droits d'acces. 

copy2(src, dst) 

Similaire a copyO mais copie egalement les dates de derniere modification et 
d'acces. 

copytree(src, dst[, symlinks [, ignore]]) 

Recopie recursivement l'arborescence de racine src vers dst en utilisant copy2 (). dst 
est un chemin qui ne doit pas encore exister. 

L'option symlinks permet de specifier si les liens symboliques sont recopies comme 
liens symboliques (syml i nks=True) ou si les ressources pointees sont recopiees en lieu 
et place des liens (syml i nks=Fal se ou non defini). 

L'option ignore permet de filtrer certains fichiers a ne pas recopier. Cette option est 
par defaut a None.Lorsqu'elle est specifiee, ignore doit etre un callable qui recoit 
pour chaque repertoire traverse le nom du repertoire et la liste de ses elements. 
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Dans l'exemple ci-dessous (repris de la documentation officielle de Python), un log 
est emis a chaque copie. 

Logging des copies 

from shutil import copytree 
import logging 

def _"logpath(path, names): 

logging. info('Working in %s' % path) 
return [] # nothing will be ignored 

copytree(source, destination, ignore=_logpath) 

shutil fourni aussi une fonction d'exemple ignore_patterns, qui prend une liste de 
motifs de type glob pour representer les fichiers a filtrer. 

Dans l'exemple ci-dessous, les fichiers d'extension « .txt » et « .tmp » sont omis. 

Recopie conditionnelle 

from shutil import copytree, ignore_patterns 

copytree(source, destination, ignore=ignore_patterns(' * .txt' , 'tmp*')) 

rmtree(chemin, (ignore errors[, onerror]]) 

Supprime une arborescence complete. Si ignore_errors est a True, les erreurs de 
suppression seront silencieuses. Si ignore_errors est a False ou non defini, les 
erreurs sont passees a la fonction fournie dans onerror. Si onerror nest pas specifie, 
l'erreur est levee normalement. onerror doit pointer sur une fonction qui definit trois 
parametres : function, path et excinfo. 

• function determine quelle fonction du module os a provoque l'erreur 
(listdir(), removeO ou rmdir()). 

• path rappelle le chemin passe a la fonction. 

• exci nfo est un appel a sys . exc i nfo(). 

La fonction implemented pour onerror peut ensuite decider de provoquer un raise 
ou de laisser passer l'erreur. 

move(src, dst) 

Deplace une arborescence complete. 



AVERTISSEMENT Perte d'informations sous plate-forme Mac 

Pour toutes ces fonctions, certaines metadonnees ne sont pas recopiees sous Mac, et les informations 
comme le createur sont perdues. 
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dircache 



Ce module implements une version specifique de listdi r(), similaire a 
os . 1 i stdi r() mais dont le resultat est trie, puis sauvegarde en memoire, dans le dic- 
tionnaire cache, global au module di rcache. 

Les appels suivants se basent alors sur la date de modification du repertoire pour 
eviter de relire l'arborescence si rien n'a change. Cette approche permet d'augmenter 
tres sensiblement les performances des programmes qui accedent regulierement au 
systeme de fichiers. 

Utilisation du cache 

>» import dircache 

>» di rcache. listdi r('/') 

[' .autofsck' , '.rnd', ' .thunderbi rd' , 'backups', 'bin', 'boot', 



initrd', 'lib', 'lost+found' , 'mnt' 
'sbin', 'service', 'slapd.log', 
'var'] 

.rnd', ' .thunderbi rd' , 'backups', 
etc', 'home', 'initrd', 'lib', 



'command', 'dev' , 'etc', 'home', 

'nohup.out', 'opt' , 'proc' , 'root' 

'src', 'srv', 'sys', 'tmp', 'usr' 

>» di rcache. cache 

{'/': (1124398584, ['.autofsck', 

'bin', 'boot', 'command', 'dev', 

'lost+found', 'mnt', 'nohup.out', 'opt', 'proc', 'root', 'sbin', 

'service', 'slapd.log', 'src', 'srv', 'sys', 'tmp', 'usr', 'var'])} 

di rcache fournit aussi une fonction reset() pour vider le dictionnaire cache. 

filecmp 

Permet de comparer des fichiers et des repertoires complets. 
cmp(fl, f2(, shallow=True[, use_statcache]]) ->booleen 

Compare le fichier nomme fl avec le fichier f2. Si shallow est a True, les fichiers 
sont consideres egaux si un appel a os . stat() est identique pour les deux. Si shal 1 ow 
est a False, une lecture du fichier est effectuee pour la comparaison. Lorsqu'une 
comparaison par lecture est effectuee, le resultat est systematiquement mis en cache 
et n'est recalcule que si les dates des fichiers changent. use_statecache est obsolete 
depuis la version 2.3. 

class dircmp(a, b(, ignore(, hide]]) -> instance 

Cree un objet de type di rcmp, qui permet de comparer les repertoires a et b. ignore 
est une liste de noms a ignorer et est par defaut initialisee a [ ' RCS ' , ' CVS ' , 
'tags'], hide est une liste de noms a ne pas afficher et est par defaut initialisee a 
[os.curdir, os.pardi r], soit [' . ' , '..'] sous Unix et MS-Windows. 
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di rcmp fournit ensuite un certain nombre de methodes : 

• report () : affiche sur la sortie courante un comparatif entre a et b . 

• reportj>artial_closure() : affiche sur la sortie courante un comparatif entre a 
et b et entre les sous-repertoires communs. 

• report_fu"l~l_c~losureO : affiche sur la sortie courante un comparatif entre a et b 
et entre les sous-repertoires communs, de maniere recursive. 

Outre ces rapports, di rcmp possede des attributs qui permettent de recuperer des 
informations sur la comparaison effectuee, soit : 

• 1 ef t_l i st : fichiers et sous-repertoires de a, filtres par hi de et i gnore ; 

• ri ght_l i st : fichiers et sous-repertoires de b, filtres par hi de et i gnore ; 

• common : fichiers et sous-repertoires communs ; 

• left_only : fichiers et sous-repertoires communs uniquement presents dans a ; 

• right_only : fichiers et sous-repertoires communs uniquement presents dans b ; 

• common_di rs : sous-repertoires communs ; 

• common_files : fichiers communs ; 

• common_funny : elements communs mais dont les types different, ou elements 
ayant provoque une erreur dans os . stat () ; 

• same_f i 1 es : fichiers communs et de contenus identiques ; 

• diff_files : fichiers communs mais de contenus differents ; 

• f unny_f i 1 es : fichiers communs qui n'ont pas pu etre compares ; 

• subdi rs : dictionnaires contenant des objets de type di rcmp associes aux ele- 
ments de la liste common_dirs. 

Comparaison des versions 2.3 et 2.4 de Python 

>» import filecmp 

>» comp = filecmp.di rcmp('/usr/lib/python2 .4' , '/usr/lib/python2 . 3 ') 

>» nouveautes = comp.left_only 

>» disparus = comp. right_only 

>» modifies = comp. diff_fi les 

>» inchanges = comp. same_fi les 

>» nouveautes 

['_LWPCookieJar. py' , 'cookielib.py' , ' subprocess .py ' , 'decimal . py' , 

'_MozillaCookie3ar.py' , '_threading_local . py' ] 

>» disparus 

['TERMIOS.py' , 'FCNTL.py', 'pre.py'] 

>» modifies 

['weakref . py' , 'ihooks.py', 'pydoc.py' 'whichdb.py ' , 'string. py'] 

>» inchanges 

['Cookie.py ' , 'MimeWriter. py' , ..., 'user.py', 'uu.py'] 
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A SAVOIR Combiner dircmp et difflib 

Cet outil peut etre combine a di f f 1 i b, pour afficher precisement les differences entre les fichiers com- 
muns dont le contenu varie. 



Outils de compression 



gzip 



Python inclut dans sa bibliotheque standard un module zl i b qui encapsule la biblio- 
theque systeme zlib. Cette derniere, distribute par gzip, fournit un algorithme de 
compression utilise dans la plupart des formats de fichiers archives. 

C'est le cas bien sur du format gzi p mais aussi du format zi p, sachant que les fichiers 
zi p peuvent etre compresses en suivant plusieurs methodes, dont zlib. 

Enfin, le format tar utilise aussi la compression zlib pour construire et lire des 
archives de type tar gzipped. 

Cette section presente les modules qui permettent de travailler avec des archives gzi p 
et zip, sachant que les modules bz2 et tarfile sont respectivement bases sur le 
meme mode operatoire. 



Le format gzi p permet de compresser des donnees dans un fichier archive. II est en 
general utilise avec les utilitaires GNU gzi p et gunzi p, qui prennent en parametre un 
fichier et le compressent dans une archive d'extension . gz. 

Le module gzip fournit une classe similaire a une classe de type file, qui permet 
d'acceder de facon transparente aux donnees d'une archive gzi p, en lecture et en ecri- 
ture, comme si le fichier n'etait pas compresse. 

class GzipFile([filename[, mode(, compresslevel[, fileobj))))) 

La classe GzipFile peut etre instanciee avec un objet fileobj representant les don- 
nees. f i 1 eobj peut etre un objet de type file ouvert, un objet Stri nglO, ou tout autre 
objet qui puisse simuler les methodes des objets de type fichier (read(), write(), 
seek() , etc.). f i 1 ename est ensuite utilise pour stipuler le nom de fichier qui est place 
dans l'en-tete du fichier gzi p dans le cas d'une ecriture. 

Si f i 1 ename est a None, le nom renvoye par f i 1 obj . name est utilise. S'il est non specifie, 
mode est recupere dans f i 1 eobj lorsqu'il est disponible. S'il ne Test pas, il est fixe a rb par 
defaut. Le mode de travail peut prendre les valeurs r, rb, pour les lectures et a, ab, w ou wb 
pour les ecritures, bien qu'il soit conseille de toujours utiliser les modes binaires. 
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Lorsque fileobj est passe en parametre, son ouverture et sa fermeture sont a la 
charge du developpeur, en amont et en aval. Ce fonctionnement autorise la recupera- 
tion de flux compresses sans pour autant forcer une ecriture de fichier sur le systeme. 

Dans le cas ou f i 1 ob j n'est pas specifie ou a None, la classe utilise le nom de fichier 
fourni dans filename pour ouvrir un nouvel objet file, en utilisant le mode fourni 
ou par defaut, rb. 

compressl evel permet de specifier le niveau de compression pour les ecritures et est 
fixe a 9 par defaut, soit le niveau de compression le plus fort et le plus gourmand en 
temps CPU. Les niveaux varient de (le moins compresse mais le plus rapide) a 9. 

open(fichier(, mode[, compresslevel))) 

Raccourci direct permettant d'instancier un nouvel objet de type GzipFile sur le 
fichier, a la maniere de la primitive open(). 

open () est utilisee dans l'exemple ci-dessous, pour simuler le fonctionnement de base 
des outils gzi p et gunzi p. 

Module gzipper.py 

#!/usr/bin/python 
# -*- coding: ISO-8859-15 -*- 
""" Ce module simule le fonctionnement 
de base de gzip et gunzi p 

import sys 

import os 

from optparse import OptionParser 

from gzip import open as gzopen 

option_l = {'noms': ('-c', '--compress'), 'dest' : 'compress', 
'action': 'count', 'help': 'fichier a compresser'} 

option_2 = {'noms': ('-d', '--decompress'), 'dest': 'decompress', 
'action': 'count', 'help': 'fichier a decompressed} 

options = [option_l, option_2] 

def _compress(filename, compresslevel=9) : 

""" compresse un fichier en une archive gzip 

attention, ecrase un eventuel fichier filename+" .gz" 
et ne cree que des archives par lecture binaire 

original = open (filename, mode='rb') 
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try: 

compressed = gzopen(f"Mename+' .gz' , mode='wb') 
try: 

for line in original . read! ines() : 
compressed. write (line) 
finally: 

compressed.closeO 
os. remove(filename) 
finally: 

original .closeO 

def _decompress(filename) : 

""" decompresse une archive gzip 

attention, ecrase un eventuel fichier "resultfile" 

archive = gzopen(filename) 
try: 

if filename.endswithC .gz') : 

resultfile = filename[ :-3] 
else: 

resultfile = '%s .uncompressed' % filename 

uncompressed = open(resultfile, mode='w') 
try: 

for line in archive. readlines() : 
uncompressed . wri te(l i ne) 
finally: 

uncompressed.closeO 
os. remove(filename) 
finally: 

archive. close() 

def main(options , arguments): 
if len(arguments) != 1: 

print 'usage: %s' % parser. usage 
sys.exit(2) 

compress = options .compress isnot None 
decompress = options. decompress isnot None 

if (compress and decompress) or (not compress and not decompress): 
print 'usage: %s' % parser. usage 
sys.exit(2) 

filename = arguments [0] 
if compress: 

_compress (filename) 
else: 

_decompress (f i 1 ename) 
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if name == ' main ': 

parser = OptionParserO 

parser. usage = 'gzipper [-cd] [fichier]' 

for option in options: 

param = option['noms'] 

del option[' noms'] 

parser . add_opti on ('-param , "'•'"•• opt i on) 
options, arguments = parser. parse_args() 
sys.argv[:] = arguments 
main(options , arguments) 

tziade@Tarek:~/Desktop$ python gzipper. py -c started. py 

tziade@Tarek:~/Desktop$ Is started. py.gz 

started. py .gz 

tziade@Tarek:~/Desktop$ python gzipper. py -d started. py.gz 

tziade@Tarek:~/Desktop$ Is started. py 

started. py 



Bon a savoir gzip et directive with 

Le module gzi p a recemment ete etendu pour supporter la directive wi th. 
Ainsi, un fichier pourra etre traite avec: 
with gzip.open(fichier) as f: 



zipfile 



Le format zi p est plus complet que gzi p car il permet de compresser dans une meme 
archive plusieurs fichiers. Le module zi pf i 1 e fournit une classe Zi pFi 1 e de manipu- 
lation d'une archive zi p. 



class ZipFile(fichier[, mode(, compression]]) 

La classe est instanciee avec fichier, qui peut etre le nom d'un fichier ou un fichier 
de type f i 1 e ou assimile, comme pour le cas de gzi p. 

Le mode par defaut est r et peut etre fixe a r, w ou a suivant les cas (si b est ajoute, il 
est automatiquement retire). 

Le mode de compression peut etre ZIP_STORED (pas de compression, valeur par defaut) 
ou ZIP_DEFLATED (compression zlib, avec un niveau de compression par defaut). 



Principaux modules 

Chapitre 8 

Une fois l'instance creee, une serie de methodes est disponible : 

closeO 

Ferme 1' archive. Doit obligatoirement etre appelee pour valider des ecritures. 

getinfo(nom) -> objet Zipinfo 

Renvoie des informations concernant 1' element nom de l'archive dans un objet de type 
Zipinfo. 

infolist() -> liste d'objets Zipinfo 

Renvoie une liste ordonnee d'objets Zipinfo, pour chaque entree de l'archive. 

namelistO -> liste d'entrees 

Renvoie une liste ordonnee des noms des entrees de l'archive. 

printdirO 

Affiche sur la sortie standard le contenu de l'archive. 

read(name) -> data 

Renvoie le contenu de l'entree name, pour une archive ouverte en mode r ou a. 

testzip() -> None ou le premier fichier defectueux 

Passe en revue toutes les entrees de l'archive, et teste les codes CRC. Renvoie le nom 
de la premiere entree defectueuse ou None si tout est correct. 

write(fichier[, arcname[, compress type]]) 

Ajoute a l'archive, ouverte en mode w ou a, le fichier. S'il est fourni, le parametre 
arcname sera utilise pour le nom de l'entree. compress_type permet de specifier un 
mode de compression different de celui general a l'archive si necessaire. 

writestr(zinfo or arcname, bytes) 

Ecrit les donnees contenues dans l'objet stri ngbytes dans l'archive ouverte en mode 
w ou a, en utilisant comme nom d'entree celui fourni dans zinfo_or_arcname (objet 
stri ng ou objet Zi plnfo). 

debug 

Attribut specifiant le niveau de debogage utilise. A (par defaut), ne donne aucune 
information. De 1 a 3 : informations de debogage, de plus en plus completes, sur la 
sortie standard. 
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class Ziplnfo((fichier(, date time))) 

Classe complementaire a ZipFile contenant des informations sur une entree 
d'archive. Peut etre utilisee en entree de la methode writestrO ou retournee par 
getinfoO ou "infolistO. 

Peut etre construite avec deux parametres optionnels. fi chi er est le nom de l'entree 
et date_time un tuple de six valeurs entieres : Annee, Mois, Jour, Heures, 
Mi nutes , Secondes, representant la date de derniere modification de l'entree. 

Les autres attributs interessants de Zi plnf o sont : 

• compress_type : type de compression de l'entree ; 

• comment : commentaires sur l'entree ; 

• vol ume : numero de volume de l'entree ; 

• CRC : CRC-32 des donnees decompressees ; 

• compress_size : taille compressee des donnees de l'entree ; 

• fi 1 e_si ze : taille decompressee des donnees de l'entree. 

is zipfile(fichier) -> booleen 

Renvoie True si le f i chi er est une archive de type zi p. 



Aller plus loin Exemple d'utilisation de ZipFile 

Pour un exemple complet d'utilisation de ZipFile, voir I'exercice 7 du chapitre 10. 



Programmation reseau 



Toute la programmation reseau sous Python repose sur le module has niveau socket, 
qui encapsule les primitives systeme d'acces a la couche reseau. 

Le module masque toute la complexite de la programmation reseau dans une 
approche objet, en fournissant une fonction socket () qui genere des objets de type 
socket. Ces objets publient des methodes simples pour toutes les operations reseau 
et prennent en charge, entres autres, la creation et la destruction des tampons asso- 
cies aux ressources reseau. 

L'exemple ci-dessous utilise un objet socket, pour se connecter sur la machine locale, 
sur le port 25, pour verifier qu'un serveur SMTP est actif. 



Principaux modules 

Chapitre 8 



Test SMTP 



>» import socket 

>» s = socket. socket(socket.AF_INET, socket . SOCK_STREAM) 

>» s.connect((' ' , 25)) 

>» data = s.recv(1024) 

>» data 

'220 local host ESMTP\r\n' 

>» s.close() 

Cette simplicite ne supprime pas pour autant les possibilites et toutes les fonctionna- 
lites de la couche reseau restent accessibles en Python. Pour plus d'informations sur 
le module socket, l'exercice 13 du chapitre 10 implements un client/serveur TCP. 

Quoi qu'il en soit, a moins d'implementer un protocole reseau exotique ou un serveur 
particulier, il est tres rare de devoir utiliser directement le module socket. La biblio- 
theque standard fournit des modules pour la plupart des protocoles reseau connus. 

Cette section presente deux modules qui implementent des clients pour les proto- 
coles HTTP(S) et FTP (RFC 959). 

Les autres protocoles sont accessibles via les modules imaplib, smtplib, nntplib, et 
consorts. 



urllib2 



Le module url 1 i b2, version plus avancee qu'url 1 i b, utilise le module httpl i b, pour 
proposer des fonctionnalites d'acces a des URL {Universal Ressource Locator). Les 
URL sont en general les adresses de pages web. 

urll i b2 gere tous les aspects du protocole HTTP, comme l'authentification, les coo- 
kies, les redirections, ou encore les flux securises. 

Pour des appels simples, urllib2 fournit une fonction url open () qui permet de 
recuperer sous la forme d'un flux de type fichier le contenu de la ressource. 

Lorsqu'il est necessaire de mettre en ceuvre des options particulieres du protocole 
HTTP, comme l'authentification, la gestion des redirections, ou les GET et POST, 
url 1 i b2 fournit un systeme de handlers. Chaque option du protocole est alors geree par 
une classe specialised, appelee handler. (HTTPBasicAuthHandler pour l'authentification, 
HTTPRedi rectHandl er pour les redirections, HTTPHandl er pour les GET et POST). 

Ces handlers sont regroupes dans un objet appele OpenerDi rector, genere par la 
fonction build_opener(), et mis en place pour etre utilise par urlopen(), park biais 
de la fonction install_opener(). OpenDi rector invoque alors lebon handler, aubon 
moment, en fonction des besoins. 
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urlopen(url [, data]) -> objet de type fichier 

Ouvre FURL pointee par url et renvoie un objet de type fichier, qui possede deux 
methodes supplementaires par rapport a un objet file classique. geturl (), qui ren- 
voie l'URL, et infoO, qui renvoie un dictionnaire contenant des metadonnees con- 
cernant la ressource ouverte. 

url peut etre un objet stri ng qui pointe directement sur la ressource, comme la ver- 
sion du module url lib, mais aussi un objet Request, qui peut contenir des informa- 
tions de requetage plus etendues. 

Lecture d'une page web CPS 

>» import urllib2 

>» result = urllib2.urlopen('http://localhost:8080/cps') 
>» for line in result. readlinesO : 
print line[: -1] 

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional //EN" "http:// 
www. w3 . org/TR/xhtml 1/DTD/xhtml 1-t ransi ti onal . dtd"> 

<html xmlns="http://www. w3.org/1999/xhtml " lang="en" 
xml :lang="en"> 
<head> 

<meta http-equiv="Content-Type" content="text/html ; 
charset=ISO-8859-15" /> 

<meta name="generator" content="Nuxeo CPS http://www.cps-project.org/ 
" /> 

<title>CPS Portal </title> 

<base href="http://localhost:8080/cps/" /> 



</body> 
</html> 

Pour certaines ressources HTTR data peut contenir des donnees a envoyer au ser- 
veur. Ces donnees doivent etre au format application/x-www-form-url encoded qui 
est obtenu en appelant url .url encode () avec un mapping. Cette fonction forme une 
chaine de requete cleO=valeurO&clel=valeurl&. . ., similaire a celle que Ton peut 
retrouver sur certaines URL. url open () concatene data a url au moment de l'appel. 

Creation d'une chaine application/x-www-form-urlencoded 

>» import url lib 

>» data = {'clientno': '12', 'theme': 13} 
>» urllib.urlencode(data) 
' theme=13&cl i entno=12 ' 



Principaux modules 

Chapitre 8 

class OpenDirector() 

Classe gerant une collection de handlers. Les instances sont construites par un appel 
a build_opener(). Presente une methode open() similaire a openurl (), pouvant etre 
utilisee pour invoquer les handlers contenus dans l'objet. Cette methode appelle tour 
a tour chaque handler de sa collection et renvoie le resultat des qu'un handler a 
accepte de prendre en charge la demande. 

install opener(opener) 

Definit l'objet opener de type OpenDi rector comme l'objet utilise par defaut par tout 
appel a openurl (). C'est la methode open() de l'objet opener qui est appelee dans ce cas. 

build opener([handler, ...]) -> instance OpenDirector 

Raccourci pour creer un objet OpenDirector garni. Renvoie un objet de type 
OpenDi rector qui contient une collection ordonnee de handlers : 

• ProxyHandler : handler de proxy. 

• UnknownHandler : gere toutes les URL de protocole inconnu. 

• HTTPHandler : gere les URL HTTP. 

• HTTPDefaultErrorHandler : gere les erreurs renvoyees par le serveur. 

• HTTPRedi rectHandler : gere les redirections. 

• FTPHandl er : gere les acces a des URL de type ftp. 

• Fi 1 eHandl er : gere les acces aux URL fichiers. 

• HTTPSHandl er : gestion du protocole HTTPS si la version de Python le permet. 

• HTTPErrorProcessor : gere les erreurs. 

La fonction peut prendre en parametre des handlers supplementaires, qui viennent 
remplacer les handlers de la liste predefinie, en fonction de leurs types. Les handlers 
sont conserves dans l'ordre fourni, sauf dans le cas ou la valeur de l'attribut 
handler_order du handler est modifiee. Cet attribut est fixe a 500 par defaut pour 
tous les handlers, sauf celui pour ProxyHandler qui est a 100. 

class HTTPBasicAuthHandler([password mgr]) 

Handler de gestion d'authentification. Si password_mgr est fourni, doit etre un objet 
de type HTTPPasswordMgr. Les objets HTTPPasswordMgr sont des objets qui conservent 
des couples (nom d'utilisateur, mot de passe), associes a des couples (realms, urls). 

class HTTPPasswordMgrO 

Permet de conserver des couples (nom d'utilisateur, mot de passe), associes a des cles 
(realms, urls). Cette classe peut etre utilisee pour memoriser les parametres de con- 
nexion a des pages qui necessite une authentification. 
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class Request(url[, data][, headers]!, origin req host] [, unverifiable]) 

Request permet de regrouper des informations pour une requete a effectuer avec 
urlopen(). url est l'URL a ouvrir, data les eventuelles donnees annexes a trans- 
mettre, headers un dictionnaire contenantles en-tetes de la requete. 

origin_req_host et unverifiable permettent de gerer certains aspects de fonction- 
nement des cookies, ori gi n_req_host definit le request-host a l'origine de la requete, 
qui sera utilise par le serveur distant dans les cookies. Le request-host est le nom 
d'hote racine de l'URL appelee. II est par defaut obtenu par l'extraction de la racine 
d'url. unverifiable, par defaut a False, permet de specifier si la requete n'est pas 
verifiable. Une requete non verifiable est une requete qui est declenchee sans l'aval 
manuel de l'utilisateur. Par exemple, la requete qui recupere une image sur une page 
web est unverifiable. 

Lexemple ci-dessous accede a la page de gestion securisee d'un serveur web local 
Zope ecoutant sur le port 8080. 

Acces avec authentification 

>» import urllib2 

>» handler = urllib2 .HTTPBasicAuthHandlerO 

>» handler. add_password('Zope' , 'localhost:8080' , 'demo', 'demo') 

>» opener = urllib2 .build_opener(handler) 

>» urllib2 . install _opener (opener) 

>» result = urllib2 .urlopen('http://localhost:8080/manage') 

>» for line in result. readlinesO : 
print line[:-l] 



<!D0CTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional //EN" 

www.w3.org/TR/REC-html40/loose.dtd"> 

<html> 

<head> 

<title>Zope on http: //local host :8080</title> 



</html> 



'http:// 



ftplib 



Le module f tpl i b fournit une classe FTP qui implements un client ftp complet. 
Une session FTP est en general composee de ces etapes : 

• connexion ; 

• authentification ; 
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• manipulations ; 

• deconnexion. 

class FTP([host[, user[, passwd[, acct]]]]) 

Lorsque host est fourni, la methode connect () est aussi appelee avec. Si le para- 
metre user est fourni, un appel a la methode "loginO est ensuite effectue. passwd et 
acct sont ajoutes a l'appel si fournis. acct est un parametre qui permet de choisir un 
compte ftp particulier, si le serveur implemente cette commande (ACCT). 

Les methodes principales accessibles dans un objet de type FTP, sont : 

abort() 

Stoppe un transfert en cours (reussite non garantie). 

closeO 

Ferme une connexion sans envoyer de commande QUIT au serveur. L'objet devient 
alors inutilisable. 

connect(host[, port]) -> resultat 

Tente une connexion de l'objet au serveur host et renvoie la reponse recue sous forme 
de string. Un seul appel est necessaire au debut de la session, port est par defaut a 21. 
Si l'objet a ete preliminairement cree avec le parametre host, il nest pas necessaire 
d'utiliser connect (). Dans le cas contraire, cette methode est la premiere a appeler. 

cwd(pathname) -> resultat 

Change le repertoire en cours sur le serveur et affiche le resultat de l'operation. 

delete(filename) -> resultat 

Supprime le fichier f i 1 ename sur le serveur et renvoie le resultat de l'operation. Une 
erreur est levee en cas d'echec. 

dir(argument[, ...]) -> listing 

Recupere un listing du repertoire en cours, par le biais de la commande LIST. Le 
resultat est envoye dans la sortie standard. Des arguments supplementaires peuvent 
etre fournis, et sont concatenes a la commande envoyee au serveur (comme le nom 
d'un sous-repertoire a lister). Si le dernier argument fourni est une fonction, elle est 
appelee pour chaque entree du listing, pour pouvoir etre parsee. 
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login([user[, passwd[, acct]]]) 

Se connecte au serveur FTP en utilisant les parametres user et passwd s'ils sont 
fournis. Si user n'est pas fourni, anonymous est utilise. Si user est a anonymous et 
que le passwd n'est pas fourni, anonymous@ est utilise pour ce deuxieme champ. 
loginO ne doit pas etre appelee si l'objet a ete preliminairement initialise avec use. 
Dans le cas inverse, doit toujours etre appelee apres la connexion. Les operations sur 
le serveur ne peuvent etre effectuees pour la plupart qu' apres un appel a 1 ogi n () . 

mkd(pathname) -> chemin absolu 

Cree un nouveau repertoire sur le serveur, et renvoie son chemin complet. 

nlst(argument[, ...]) -> liste de fichiers 

Equivalente a di r(), mais renvoie les fichiers sous forme de liste et ne gere pas de 
fonction cal 1 back. 

pwd() -> chemin courant 

Renvoie le chemin courant sur le serveur. 

quit() 

Envoie le signal QUIT au serveur, et ferme la connexion, close () doit ensuite etre 
appelee. 

rename(ancien_nom, nouveau nom) -> resultat 

Renomme le fichier distant ancien_nom en nouveau_nom. 

retrbinary(commande, callback!, maxblocksize[, rest]]) 

Recupere un fichier en mode binaire, par le biais de la commande, de la forme « RETR 
nom de fichier ». callback est une fonction appelee a chaque bloc de donnees 
recu, maxbl ocksi ze permet de definir la taille maximale des blocs en octets. 

rest est une chaine de caracteres optionnelle et qui sera utilisee en parametre de la 
commande RESTART par le serveur au cas ou le transfert est interrompu. C'est un 
marqueur qui determine la position ou reprendre le chargement. 

retrlines(commande [, callback]) 

Recupere les donnees en ligne, par le biais de la commande, de la forme « RETR nom de 
fichier ». callback est une fonction appelee a chaque bloc de donnees recu. Si 
callback n'est pas fournie, la ligne est imprimee par le biais de 
ftplib. pri nt_line(). 



Principaux modules 

Chapitre 8 



rmd(dirname) -> resultat 

Supprime le repertoire di rname. 

storbinary(commande, file[, blocksize]) 

Envoie un fichier pointe par un objet file ouvert en lecture, commande est de la 
forme « STOR nom fichier », blocksize determine la taille du tampon de lecture 
(8192 par defaut). Le fichier est envoye en mode binaire. 

storlines(commande, file) 

Equivalente a storbi nary, pour les fichiers texte. Envoie le contenu du fichier ligne 
a ligne. 

Session FTP 



>» import ftplib 

>» ftp = ftplib. FTP ('local host') 

>» ftp.getwelcome() 

'220 ProFTPD 1.2.10 Server (ProFTPD Default Installation) [127.0.0.1]' 

>» ftp.login('tziade' , 'xxx') 

'230 User tziade logged in.' 

>» ftp.dir() 

-rw-r--r-- 1 (?) tziade 4704 

-rw-rw-r-- 1 (?) tziade 473 

-rw-r--r-- 1 (?) tziade 292694 

enigmail -0.91.0-tb-linux.xpi 



Jul 27 19:58 5505. tgz 
Feb 15 2005 backup. sh 
Mar 27 22:09 



-rw-rw-r-- 
-rw-r--r-- 
drwxr-xr-x 
drwxr-xr-x 



1 (?) 

1 (?) 
13 (?) 

2 (?) 



>» ftp.quitO 
'221 Goodbye. ' 



tziade 10315 Ian 3 2005 install. py 
tziade 9269 May 3 14:05 log.txt 

tziade 4096 Jul 11 23:37 server 
tziade 4096 Jul 11 23:37 www 



En un mot... 



Cette premiere serie de modules constitue une bonne trousse a outils pour la pro- 
grammation systeme. Le prochain chapitre aborde des modules plus orientes sur la 
programmation. 
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Principaux modules, partie 2 



Ce chapitre presente les modules majeurs de la bibliotheque standard couvrant les 
themes suivants : 

• persistance ; 

• conversion, transformation de donnees ; 

• calculs numeriques ; 

• structures de donnees ; 

• utilitaires divers. 



Persistance 



Python fournit dans sa bibliotheque standard des outils de serialisation d'objets de 
tres haut niveau, qui peuvent permettre a un programme de sauvegarder des donnees 
et de les recharger sans avoir a mettre en place un systeme de sauvegarde plus pousse, 
comme une base de donnees. 

Les modules cPickle et shelve offrent des fonctionnalites de sauvegarde totalement 
transparentes qui memorisent l'etat des attributs d'un objet quelconque. Cette 
approche generique permet de beneficier directement de ce mecanisme sans avoir a 
mettre au point du code specifique. 
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cPickle 



cPickle offre un mecanisme de serialisation des objets tees puissant : tout objet en 
memoire peut etre sauvegarde sur le systeme de fichiers puis recharge par la suite. 
cPi ckl e est le grand frere du module pi ckl e : il implements a peu de choses pres les 
memes fonctionnalites mais est code en C, done beaucoup plus rapide. 

cPickle est superieur au module de fonctionnalites similaires marshal car il permet 
de serialiser de maniere transparente tout type de classe. 

Le mecanisme de serialisation ne sauvegarde pas le code des fonctions ni les 
parametres : une simple reference est conservee et il est necessaire de pouvoir 
retrouver ces definitions lorsqu'un objet est de-serialise. 

Les rares types d'objets ne pouvant etre serialises par cPickle sont dits unpickable et 
sont les instances de socket, les pointeurs de fichiers et les threads. Les objets compa- 
tibles sont dit pickable. 

cPi ckl e fournit deux types de fonctions pour serialiser les objets : 

• dumpO et loadO, pour une ecriture et une lecture directe dans un objet de type 
fichier ; 

• dumps () et loads(), pour recuperer et fournir les flux sous forme de string. 

dump(objet, fichier[, protocol]) 

Serialise l'objet. fichier est un objet qui doit presenter une methode write(), uti- 
lisee par dump(). C'est en general un objet de type fichier (ouvert en ecriture) ou assi- 
mile, comme StringlO. 

protocol est un parametre qui permet de determiner la structure creee pendant la 
serialisation. Avec une valeur a par defaut, cette structure reste la meme pour toutes 
les versions de Python passees ou a venir et assure ainsi une compatibilite ascendante. 
1 determine une structure plus efficace et 2 la meilleure structure possible. 

Pour Python 2.4 et superieur, la valeur 2 peut etre recuperee par la variable 
cPickle.HIGHEST_PROTOCOL, qui determine la valeur maximum pour la version cou- 
rante, sachant que les prochaines versions introduiront certainement des valeurs sup- 
plementaires. Une valeur negative est equivalente a cPi ckl e . HIGHEST_PROTOCOL. 

load(fichier) -> objet 

Utilise l'objet fi chi er pour reconstruire l'objet serialise, f i chi er est un objet de type 
file ou assimile qui doit fournir les methodes readQ et readlinesQ. 
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dumps(objet(, protocole]) -> chaine 

Similaire a dump(), mais renvoie le resultat de la serialisation dans un objet de type str. 

loads(cha?ne [, protocole]) -> objet 

Similaire a load() mais utilise un objet de type str plutot qu'un fichier. 

Utilisation de loads et dumps 

>» from cPickle import loads, dumps 
>» class MyClass(object) : 

def init (self): 

self. data = [1, 2, 3] 

>» instance_of = MyClassO 

>» instance_of .data.append(56) 

>» serialisation = dumps (instance_of) 

>» serialisation 

"ccopy_reg\n_reconstructor\npl\n(c main \nMyClasse\np2\nc builtin \ 

nob ject\np3\nNtRp4\n(dp5\nS' data' \np6\n(lp7\nIl\naI2\naI3\naI56\nasb. " 
>» more = loads(serialisation) 
>» more. data 
[1, 2, 3, 56] 

Plusieurs objets peuvent etre serialises dans le meme flux, grace a la classe Pickler, 
qui permet de gerer un fichier et d'y accumuler des objets, et a la classe Unpi ckl er qui 
renvoie les objets reconstruits. 

class Pickler(fichier [, protocole]) 

Pickler s'instancie avec un objet de type file comme dumpO et offre deux 
methodes : 

• dump (object) : serialise 1' objet dans le fichier. Peut etre appelee plusieurs fois 
pour stocker plusieurs objets. 

• clear_memo() : permet d'initialiser le cache interne, qui contient l'ensemble des 
objets visites par les serialisations. Utile lorsque l'objet est reutilise. 

class Unpickler(fichier) 

Unpi ckl er fournit une interface de deserialisation : 

• 1 oad () : lit le flux et retourne un objet. Peut etre appelee plusieurs fois pour recu- 
perer les objets stockes dans le flux. Lorsque la fin des donnees est atteinte, une 
erreur EOFError est levee. 

• NoloadO : similaire a load() mais ne charge pas les objets en memoire (des 
objets None sont renvoyes). Permet de parcourir la structure. 
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Utilisation de Pickler et Unpickler 

>» from cPickle import Pickler, Unpickler 

>» class MyClass(object) : 

... def init (self, name): 

self. data = [1, 2, 3] 

self .name = name 

>» def load (objects) : 
... f = Pickler(open('datas' , 'w')) 

... for obj in objects: 

f .dump(obj) 

>» def unload() : 

... f = Unpickler(open('datas' , 'r')) 

objects = [] 
while 1: 
try: 
... objects .append(f.load()) 

... except EOFError: 

break 
return objects 

>» load([MyClass('l'), MyClass('2 ')]) 
>» objects = unload() 
>» for obj in objects: 
print(obj .name) 



shelve 



Le module shelve se base sur cPickle pour fournir un systeme de dictionnaire per- 
sistent. Ce dictionnaire est utilise comme tout autre dictionnaire dans le programme 
et peut contenir tout objet pickable. Les donnees sont sauvegardees dans une base de 
donnees sur le systeme de fichiers. 

Le type de base de donnees utilise est choisi automatiquement et depend des biblio- 
theques installees sur le systeme, et peut etre : 

• une base dbm sous Unix ; 

• une base GNU/dbm sous Unix ; 

• une base Berkeley DB sous Unix et Windows. 

shelve fournit une fonction openQ qui retourne une instance d'un tel dictionnaire. 
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open(nom_fichier[, flag[, protocole[, writeback]]]) 

Ouvre un dictionnaire persistent contenu dans le fichier nom_fichier. flag deter- 
mine le type d'ouverture, a savoir : 

• r : lecture seule ; 

• w : lecture-ecriture ; 

• c : creation si base de donnee inexistante, puis acces en lecture-ecriture (valeur 
par defaut). 

protocol e, s'il est fourni et different de None, est passe directement a cPickle, et 
determine la structure de serialisation (voir la section precedente). 

Lorsque writeback est fourni et different de True, shelve conserve en memoire tous 
les elements modifiables du dictionnaire et les reecrit dans le fichier au moment de la 
fermeture. Cette option permet de mettre a jour automatiquement ces elements mais 
peut devenir relativement gourmande en memoire. 

Utilisation de shelve 

>» import shelve 

>» import builtin 

>» documentation = shelve. open('primitives.db') 

>» for element in dir( builtin ): 

if element. startswith('_') : 
continue 

doc = getattr( builtin , element). doc 

try: 

documentation [element] = doc 
except TypeError: 

print 'impossible de pickler %s' % str(doc) 

>» documentation. close() 

>» documentation = shelve. open('primitives.db') 

>» for element in documentation: 

printC'primitive %s:\n%s\n\n' % \ 

(el ement , documentati on [el ement] )) 

[...] 

primitive getattr: 

getattr(object, name[, default]) -> value 

Get a named attribute from an object; getattr(x, 'y') is equivalent to 

x.y. 

When a default argument is given, it is returned when the attribute 

doesn't 

exist; without it, an exception is raised in that case. 
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Conversion, transformation de donnees 

Les algorithmes les plus frequemment utilises pour l'encodage de donnees, que ce 
soit pour leur transport ou leur hachage, sont fournis dans la bibliotheque standard 
sous forme de fonctions tres simples d'usage. 

Cette section presente base64 et hashlib. 



base64 



base64 fournit des fonctions d'encodage et de decodage de donnees binaires au for- 
mats definis par la norme RFC3548, a savoir basel6, base32 et base64. Cet encodage 
fait correspondre a chaque valeur un signe de l'alphabet basel6, 32 ou 64. II est uti- 
lise pour transformer des donnees binaires en donnees texte qui peuvent etre trans- 
porters dans certains protocoles d'echanges qui ne supportent que du texte, comme 
HTTP ou IMAP4. 

b64encode(chaine[, altchars)) -> chaine 

Encode les donnees contenues dans l'objet string chaine. Si altchars est specifie et 
est different de None, c'est un objet string de longueur 2, qui definit un caractere spe- 
cifique pour les caracteres + et /. Cette variation permet de definir des flux base64 
compatibles avec certains formats, comme les URL. 

b64decode(cha?ne(, altchars]) -> chaine 

Decode les donnees contenues dans chai ne. 

Les autres formats sont rarement utilises, et le module base64 fournit des fonctions 
raccourcis pour encoder et decoder en base64, a savoir : 

• encodestring(s) : equivalente a b64encode(s) ; 

• decodestring(s) : equivalente a b64decode(s) ; 

• encode(input, output) : encode le contenu pointe par l'objet input vers l'objet 
output, input et output sont des objets de type fichier ou assimiles, et doivent 
etre ouverts dans les bons modes ; 

• decode(input, output) : equivalente a encode (), mais pour le decodage. 

Encodage d'un fichier binaire 

>» from base64 import encode, decode 

>» fichier_pdf = open('CPS.pdf, 'r') 

>» fichier_pdf_b64 = open('CPS.pdf .b64' , 'w') 

>» encode (fichier_pdf, fichier_pdf_b64) 
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>» fichier_pdf_b64.c"loseO 

>» fichier_pdf_b64 = open('CPS.pdf .b64' , 'r') 

>» for i in range(5): 

... fichier_pdf_b64. readlineQ 



']VBERi0xLjQNCiXk9tzfDQoxIDAgb2]qDQo8PCAvTCVuZ3RoIDIgMCBSDQogICAvRmlsdCVyIC9C\n' 
'bCF0ZURlY29kZQ0KPj4NCnN0cinVhbQ0Ke]yVWtuqZMcNfT9w/mE/C9Ku+wVMII7HkEeDIR+QxAnB\n' 
' J8F+ye+nSl pLpd09nhAMnl arSpcl 1 Uql 0+H6z/vbLle4f hce8epp/7+W/f 9f/3b9+avrX+9v8dr/\n ' 
7fr397ewWdfH+9ta]x9/3juu/S//r9/+4/3tp6/e3364frnqCI9+9dCu2PpjXHk88pC9FMXeyhUe\n' 
' of RQ1791 h j hFWxlxmTFi eMyts44Msi 4NddT176ai UC0pOVR/NK7cCwekbNZ41 EXFtVyo9Tl BoC7K\n ' 



haslib 



hasl i b fournit, par une serie de fonctions, une interface a 6 algorithmes de hashage, 
a savoir : 

• md5 

• shal 

• sha224 

• sha256 

• sha384 

• sha512 

Tous ces algorithmes peuvent etre manipules par des objets retournes par chacune de 
ces fonctions, et respectent la meme interface. 

Prenons l'exemple des deux algorithmes les plus utilises : md5 et shal. 

haslib.md5 

md5 fournit une implementation de l'algorithme de hachage de la RSA, le Message 
Digest 5. Cet algorithme permet de creer une cle (quasi-)unique de 128 bits, a partir 
des donnees fournies. Revenir aux donnees originelles depuis une cle de hachage est 
(quasi-)impossible. 

Ce genre de signature permet de garantir de maniere securisee l'integrite des donnees 
dans certaines situations : 

• Lorsque Ton telecharge une archive sur Internet, la cle MD5 qui peut l'accompagner 
permet de garantir que le fichier n'est pas corrompu : une fois le telechargement ter- 
mine, la cle est recalculee sur le systeme local et comparee avec la cle originelle. 

• Les systemes d'authentification stockent bien souvent des cles de hachage MD5 
au lieu des mots de passe en clair : au moment de l'authentification d'un utilisa- 
teur, ce n'est pas le mot de passe saisi qui est compare mais sa cle de hachage. 
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• Des systemes de cache memoire peuvent utiliser MD5 pour identifier une don- 
nee, etc. 

has"lib.md50 fournit un objetmd5, decrit ci-dessous. 

class md5([chaine]) 

Les objets de type md5 peuvent etre initialises avec un objet de type string. lis four- 
nissent quatre methodes : 

• update (s) : concatene l'objet de type string a la chaine deja stockee. 

• di gest() : calcule et renvoie la cle correspondant a la chaine stockee. 

• hexdigestO : calcule et renvoie la cle comme digestO, mais sous la forme d'une 
representation hexadecimale. C'est la forme la plus utilisee. 

• copyO : renvoie un clone de l'objet md5. Permet d'optimiser les calculs MD5 qui 
sont relativement couteux : si la chaine stockee est une sous-chaine d'une autre 
chaine a calculer, l'objet peut etre reutilise par ce biais. 

Calcul de la cle MD5 d'un fichier 

>» import hashlib 

>» cle = hashlib.md5() 

>» with open (' Plone.pdf ) as f: 

... cle.update(f . read()) 

>» digest = cle. hexdigestO 

>» digest 

' 5e6ff 71bl791f 645cfbfd0d6f8d8e522 ' 

hashlib.sha 

Les cles MD5 peuvent etre cassees en quelques jours, moyennant une puissance de 
calcul importante et des techniques complexes. La recherche des collisions est une de 
ces techniques et tente de trouver deux donnees differentes qui generent la meme cle 
de hachage. 

Lalgorithme SHA-1 offre une cle de hachage moins sensible aux collisions et plus 
difficile a casser. II est implemente par le module sha, qui fournit exactement la 
meme interface que md5. 

Calcul de la cle SHA-1 d'un fichier 

>» import hashlib 
>» cle = hashlib.shaO 
>» with open('zasync .pelf) as f: 
cle.update(f . read()) 
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>» digest = cle.hexdigestO 

>» digest 

'1332e8e7cl3c700dl32babf392216c7495alelal' 



Calculs numeriques 



math 



Python fournit des fonctions mathematiques de base, regroupees dans le module math. 
Le module cmath fournit les memes fonctionnalites pour les nombres complexes. 



Le module math fournit un certain nombre de fonctions mathematiques courantes. Ces 
dernieres accedent directement aux fonctions de la bibliotheque C et sont tres rapides. 

Elle peuvent etre regroupees en trois ensembles : 

• fonctions de conversion ; 

• fonctions trigonometriques ; 

• constantes. 

fonctions de conversion 

ceil(x) -> reel 

Renvoie, sous forme de reel, la premiere valeur entiere superieure au reel x. 

exp(x) -> reel 

Renvoie e**x. e est la constante mathematique de valeur arrondie 2 . 72. 

fabs(x) -> reel 

Renvoie la valeur absolue de x. x peut etre un entier ou un reel. Equivalente a abs() 
mais renvoie toujours un reel. 

floor(x) -> reel 

Renvoie, sous forme de reel, la premiere valeur entiere inferieure au reel x. 

fmod(x, y) -> reel 

Renvoie x modulo y Cette fonction peut renvoyer un resultat different de x % y pour 
les reels, a cause du fonctionnement des reels dans Python. fmod(x, y) est preco- 
nisee pour les reels et x % y pour les entiers. 
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frexp(x) -> (m, e) 

Decompose x en (m, e), tel que x est egal am* (2**e). 

ldexp(m, e) -> x 

Renvoie m * (2**e), soit l'inverse de frexp(). 

log(x[, base]) -> reel 

Renvoie le logarithme de x. Si base n'est pas specifie, c'est le logarithme de base e 
(logarithme naturel) qui est calcule. 

loglO(x) -> reel 

Equivalente a 1 og (x , 10) . 

pow(x, y) -> reel 

Renvoie x**y. 

modf(x) -> (fraction, entier) 

Decompose le reel en ses parties fractionnaire et entiere, sous la forme d'un tuple de 
deux reels. 

fonctions trigonometriques 

acos(x) -> reel 

Renvoie l'arc cosinus de x en radians. 

asin(x) -> reel 

Renvoie Fare sinus de x en radians. 

atan(x) -> reel 

Renvoie Fare tangente de x en radians. 

atan2(y, x) -> reel 

Equivalente a atari (y/x). 

cos(x) -> reel 

Renvoie le cosinus de x en radians. 

cosh(x) -> reel 

Renvoie le cosinus hyperbolique de x en radians. 
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degrees(radians) -> degres 

Convertit en degres un angle exprime en radians. 

hypot(x, y) -> reel 

Renvoie sqrt(x*x + y*y). Soit la norme euclidienne. 

radians(degres) -> radians 

Convertit en radians un angle exprime en degres. 

sin(x) -> reel 

Renvoie le sinus de x en radians. 

sinh(x) -> reel 

Renvoie le sinus hyperbolique de x en radians. 

sqrt(x) -> reel 

Renvoie la racine carree de x. 

tan(x) -> reel 

Renvoie la tangente de x en radians. 

tanh(x) -> reel 

Renvoie la tangente hyperbolique de x en radians. 

constantes 

e 

Constante mathematique e (constante d'Euler). 

Pi 

Constante mathematique TC. 

Calcul d'angles 

>» degres = 55 

>» degres * math. pi / 360.0 

0.47996554429844063 

>» math, sin(degres) 

-0.99975517335861985 
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Structures de donnees 

II est possible d'utiliser dans certains cas precis des types de donnees specialises. 

• array permet de gerer des listes de valeurs de type homogene ; 

• abc definit des classes de base abstraites ; 

• col 1 ecti ons offre des conteneurs haute performance ; 

• cStri nglO fournit une chaine de caracteres qui fonctionne comme un type f i 1 e ; 

• decimal permet de travailler avec des nombres decimaux. 



array 



Le module array definit une structure de donnees equivalente aux listes mais pour 
des elements du meme type. Les elements sont convertis et places dans un 
conteneur C, ce qui rend certaines manipulations beaucoup plus rapides qu'avec une 
liste. 

array(typecode[, initializer]) -> tableau 

typecode determine le type des elements stockes, et correspond aux types C. 
typecode peut prendre les valeurs suivantes : 

• c : stri ng de longueur 1 stocke dans un char ; 

• u : uni code de longueur 1 ; 

• b : entier stocke dans un signed char ; 

• B : entier stocke dans un unsigned char ; 

• h : entier stocke dans un short int ; 

• H : entier stocke dans un unsigned short int ; 

• i : entier stocke dans un signed int ; 

• I : entier stocke dans un unsigned int ; 

• 1 : entier long stocke dans un signed long ; 

• L : entier long stocke dans un unsigned long ; 

• f : reel stocke dans un float ; 

• d : reel stocke dans un double. 

initializer, si fourni, est une sequence contenant des elements a placer dans le 
conteneur. Les objets de type array fournissent des methodes de manipulation des 
elements et des methodes de conversion. 
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Methodes de manipulation 

Toutes ces methodes supposent, lorsqu'un element est fourni, qu'il est du type cor- 
respondant au tableau, sans quoi une erreur de type TypeError est levee : 

• count(x) : renvoie le nombre d'occurrences de l'element x dans le tableau. 

• extend(array or iterable) : ajoute les elements de l'array ou de la sequence 
passee. 

• index (x) : renvoie l'index de la premiere occurrence de x dans le tableau. Si x 
n'est pas present dans le tableau, une erreur Val ueError est levee. 

• i nse rt (i , x) : ajoute l'element x avant 1' element de position i . Si i est negatif, il 
correspond a l'index longueur - i. 

• pop( [i ] ) : renvoie l'element d'index i et l'enleve du tableau. Si i n'est pas fourni, 
c'est le dernier element qui est renvoye. 

• remove (x) : retire la premiere occurrence de x du tableau. Si x n'est pas present 
dans le tableau, une erreur ValueError est levee. 

• Reverse () : retourne le tableau, tel que le premier element se retrouve en der- 
niere position, et ainsi de suite. 

Methodes de conversion 

Les methodes de conversion permettent de transformer le contenu du tableau en un 
autre objet, et inversement d'importer un objet dans le tableau : 

• tof i 1 e (f ) : serialise le tableau dans 1' objet de type fichier ou assimile f . 

• tol i st () : convertit le tableau en objet list. 

• tostringO : convertit le tableau en objet string. Le contenu de l'objet string 
correspond au contenu brut en octets du tableau. 

• tounicodeO : equivalents a tostringO mais renvoie un objet Unicode et ne 
fonctionne qu'avec un array de type u. 

• fromfile(f , n) : lit n elements de l'objet de type fichier (et non assimiles). Si 
moins de n items sont disponibles, une erreur EOFError est levee. 

• fromlist(list) : ajoute les elements de la liste en fin de tableau. Si un des ele- 
ments n'est pas du bon type, l'operation est annulee et une erreur de type 
TypeError est levee. 

• fromstring(s) : ajoute les elements de la chaine de caracteres en fin de tableau. 
Les caracteres sont interpreted comme contenu brut, comme pour tostri ng(). 

• fromunicode(s) : equivalents a fromstringO, mais ajoute des caracteres Uni- 
code. Le tableau doit etre de type u. 
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Array en action 

>» import array 

>» tableau = array. array('c' , 'Oh, mon tableau, o, OOoO') 

>» tableau. count('o') 

3 

>» tableau. extend (' , tu es le plus beau des tableaux') 

>» tableau. insert(0, '0') 

OOh, mon tableau, o, OOoO, tu es le plus beau des tableaux 

>» entiers = array. array('i ' , [1, 2, 3, 4, 5]) 

>» entiers. tostringO 

'\x01\xOO\xOO\xOO\x02\xOO\xOO\xOO\x03\xOO\xOO\xOO\x04\xOO\xOO\xOO\x05\x 

00\x00\x00' 



abc 



Le module abc introduit un concept de classe abstraite, decrit dans le PEP 3119 
(voir http://www.python.org/dev/peps/pep-31 19). 

Une classe abstraite est une classe qui permet de definir un certain nombre de 
methodes dites abstraites. Une methode abstraite est une methode qui n'est pas reel- 
lement utilisee dans un programme, mais qui sert de guide a l'ensemble des classes 
derivees. 

Prenons l'exemple d'une classe Sized, qui definit la methode abstraite len . 

Definir une methode abstraite en Python peut se faire en levant une l'exception 
NotlmplementedError dans le code. 

Classe abstraite Sized 

>» class Si zed (object) : 

def _len_(self): 
... raise NotlmplementedError 



Ainsi, elle ne peut pas etre utilisee directement, et il faut implementer len_ 

une classe derivee appelee classe concrete. 

Classe Data 



dans 



>» class Data(Sized): 

def init (self): 

self ._data = [] 
... def add(self, data): 

... self ._data.append(data) 
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def _len_(self): 
... return len(self ._data) 

>» d = Data() 
>» d. add ('data') 

La classe Data peut evidemment se passer de Sized pour fonctionner dans cet 
exemple, mais cette couche d'abstraction permet d'utiliser Sized comme un mar- 

queur indiquant qu'un objet implements 1 en . Le test d'appartenance ci-dessous, 

indique qu'il est possible d'utiliser len() sur d. 

Test de I'appartenance de d a Sized 

>» isinstance(d, Sized) 

True 

>» len(d) 

1 

On peuttraduire isinstance(d, Sized) par « Est-ce queje peuxutiliser Ten surd ? ». 

abc sert a formaliser ce mecanisme. Une metaclasse ABCMeta est implementee dans ce 
module, ainsi qu'un decorateur abstractmethod. 

Sized avec abc 

>» from abc import ABCMeta, abstractmethod 
>» class Si zed (object) : 

metaclass = ABCMeta 

©abstractmethod 

def _len_(self): 
return 



Si zed utilise dans ce cas ABCMeta comme metaclasse et marque 1 en avec le deco- 
rateur abstractmethod pour indiquer que c'est une methode abstraite. 

Cette methode devra obligatoirement etre implementee, et toute tentative d'instan- 
ciation d'une classe contenant encore des methodes abstraites provoquera une erreur. 
L'utilisation explicite de NotlmplementedError n'est done plus requise. 

Creation de Data au-dessus de Sized 

>» class Data(Sized): 
pass 



La bibliotheque standard 

Troisieme partie 



>» d = Data() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: Can't instantiate abstract class Data with abstract methods 

len 

>» class Data(Sized): 

def init (self): 

self._data = [] 
def add (self, data): 

self ._data. append (data) 
def _len_(self): 

return len(self. data) 

>» d = Data() 

>» issubcl ass (Data, Sized) 

True 



Le probleme de cette implementation est qu'il reste necessaire de faire deriver Data 
de Si zed pour pouvoir beneficier du mecanisme. A terme, les arbres de derivation 
deviennent tres complexes et l'heritage multiple frequent. 

Pour eviter ce probleme, ABCMeta ajoute une fonction regi ster a la classe abstraite. Ceci 
permet de lui associer une classe arbitraire sans que cette derniere ne doive en deriver. 



Utilisation de register 



>» class Data(object) : 

def init (self): 

self._data = [] 
def add (self, data): 

self ._data. append (data) 
def _len_(self): 

return len(self. data) 

>» Sized, regi ster (Data) 
>» issubcl ass (Data, Sized) 
True 



Cette fonctionnalite desolidarise les classes des classes abstraites et rapprochent ces 
dernieres du concept d'interface. Un programme peut alors marquer des classes 
comme implementatrices de methodes defmies dans des classes abstraites. 

II est aussi possible d'exprimer cette association explicite de maniere implicite en 

implementant au niveau de Si zed une methode de classe subcl asshook , qui sera 

invoquee a chaque appel de issubcl ass. 
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Utilisation de subclasshook_ 



>» class Si zed (object) : 

metaclass = ABCMeta 

Oabstractmethod 
def _len_(self): 

return 
Oclassmethod 

def subclasshook (els, C) : 

if els is Sized: 

if any(" len " in B. diet for B in C. 

return True 
return Notlmplemented 



Pour chaque appel issubclass(C, Sized), cette methode doit retourner True si la 
classe C implements 1 en et Notlmpl emented (ou Fal se) si elle ne l'implemente pas. 

II nest done plus utile lorsque subclasshook est implementee, d'appeler 

regi ster : toute classe testee par le biais de i ssubel ass sera validee par cette methode. 

Test du hook sur des classes arbitraires 

>» issubclass(list , Sized) 

True 

>» issubclass(object, Sized) 

False 

Le module collections, presente ci-dessous, fournit une serie d'ABC {Abstract Base 
Classes). 



collections 



Ajoute dans la version 2.4, le module collections introduit des conteneurs de don- 
nees tres performants, a savoir : 

• deque : une file a double entree ; 

• def aul tdi ct : un mapping avec valeur par defaut ; 

• namedtuple : un tuple avec des accesseurs nommes. 
Enfin, collections introduit un certain nombre d'ABC. 

Le type deque 

Le type deque est un conteneur qui fonctionne comme une file, mais permet d'ajouter et 
de recuperer des donnees des deux cotes de la file, avec les memes performances. 
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deque((iterable)) 

Renvoie un objet deque, initialise avec la sequence iterable si elle est fournie. Les 
objets de type deque fournissent un certain nombre de methodes, a savoir : 

• append (x) : ajoute 1' element x a droite de la file. 

• append! eft (x) : ajoute 1' element x a gauche de la file. 

• clearO : supprime tous les elements de la liste. 

• extend(iterable) : ajoute un a un les elements de la sequence iterable a droite 
de la file. 

• extendi eft (iterable) : ajoute un a un les elements de la sequence iterable a 
gauche de la file. 

• pop() : renvoie le dernier element de la file et le retire. Si la file est vide, une 
erreur IndexError est levee. 

• popl ef t () : renvoie le premier element de la file et le retire. Si la file est vide, une 
erreur IndexError est levee. 

• rotate (n) : effectue une rotation de n pas vers la droite de la file. Une rotation 
passe le dernier element en premier, n fois. 

Utilisation d'un deque 

>» from collections import deque 

>» d = deque("Le saut a 1 'elastique") 

>» d.popO 

'e' 

>» d.popleftO 

'L' 

>» d. rotate(4) 

>» d.popO 

's' 

Le type defaultdict 

Type herite de diet, defaultdict permet d'attribuer automatiquement une valeur 
lors de la premiere utilisation d'une cle. Un callable passe en parametre du construc- 
teur et renvoie la valeur a appliquer par defaut. On appelle cela un factory. 

Dans l'exemple suivant, les cles sont initialisers par defaut a 0. En effet, i nt cree un 
entier qui vaut s'il est appele sans parametre. 

Utilisation de la factory 

>» from collections import defaultdict 
>» d = defaultdict(int) 
>» d['a'] 
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>» d 

defau"ltch'ct(<type 'int'>, {'a': 0}) 

Ce comportement permet de s'affranchir du code d'initialisation lorsque les diction- 
naires sont utilises pour des calculs sur des series. 

Occurrences de lettres dans un texte 

>» from string import lowercase 

>» from collections import defaultdict 

>» sentence = "Ceci est un texte. Banal, certes. Mais c'est un texte" 

>» counter = defaultdict(int) 

>» for car in sentence: 

... if car not in lowercase: 

continue 
... counter[car] += 1 

>» for car in lowercase: 

... print('%s: %s' % (car, counter[car])) 



a: 


3 


b: 





c: 


3 


d: 





e: 


9 


f: 





g: 





h: 





i : 


2 


J: 





k: 





1: 


1 


m: 





n: 


3 


o: 





P: 





q: 





r: 


1 


s: 


4 


t: 


7 


u: 


2 


v: 





w: 





x: 


2 


y: 





z: 
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Ainsi, l'initialisation automatique de chaque cle simplifie la conception d'un comp- 
teur d'occurrence des lettres dans un texte. 

La fonction namedtuple 

namedtuple est une fonction qui genere des tuples nommes dont les fonctionnalites 
sont etendues. namedtuple prend en parametre un nom de type et une chaine qui 
contient des noms d'attributs separes par des espaces ou des virgules. Ce nouveau 
type est comparable aux structures nominees du C++. 

Creation d'un tuple User 

>» from collections import namedtuple 

>» User = namedtuple('User' , 'first_name last_name login password') 
>» joe = User ('joe', 'biden', 'jbiden', 'obama2009') 
>» joe 

User(fi rst_name=' joe' , last_name=' biden' , 
login=' jbiden' , password='obama2009') 
>» joe. password 
'obama2009' 

Linteret des tuples nommes est de fonctionner exactement comme des tuples classi- 
ques tout en etant plus faciles a manipuler grace aux libelles attribues a chaque posi- 
tion de sequence. Si nous reprenons notre exemple, pour recuperer la valeur du mot 
de passe, joe. pas sword estbeaucoup plus explicite que joe[-l]. 

La methode de classe _make(iterable) genere egalement une instance de tuple 
nomme et lui assigne les valeurs fournies dans l'iterable. 

Utilisation de _make 

>» values = ['tarek', 'ziade', 'tziade', 'poupoum'] 
>» User._make(values) 

User(fi rst_name=' tarek' , Iast_name='ziad\xc3\xa9' , 
1 ogi n= ' tzi ade ' , password= ' poupoum ' ) 

Les Abstract Base Classes 

collections propose pas moins de seize Abstract Base Classes ou ABC. Elles se 
basent sur l'implementation des methodes speciales existantes en Python comme 

len ou iter , et permet d'associer un nom de classe abstraite a un certain 

nombre de concepts deja existants. 

La liste des ABC est accessible a l'adresse suivante : 

http://docs.python.0rg/library/collections.html#abcs-abstract-base-classes. 



Principaux modules, partie 2 

Chapitre 9 



decimal 



Introduit dans la version 2.4, le module decimal cree des objets de type Decimal afin 
de representer des nombres decimaux. Les objets de type Decimal s'instancient avec 
un objet stri ng, un entier, ou un tuple, representant le nombre decimal. 

class Decimal([value [, context]]) 

val ue peut etre : 

• un objet stri ng, qui represente un decimal en respectant la syntaxe numerique ; 

• un entier ; 

• un tuple de trois elements : 

- le signe (0 pour positif, 1 pour negatif ) ; 

- un tuple contenant tous les chiffres qui composent le decimal ; 

- un entier exposant, qui place la virgule. 

Lorsque val ue n'est pas fourni, le decimal est initialise a 0. 

context est un objet Context, qui specifie un environnement particulier pour l'objet. 

Par rapport aux entiers reels classiques, ce nouveau type presente un avantage 
interessant : sa representation reste exacte. 

Representation decimale 

>» 5.75 / 2.5 

2.2999999999999998 

>» from decimal import Decimal 

>» Decimal ('5. 75') / Decimal ('2 . 5 ') 

Decimal ("2.3") 

II est en outre possible de definir le degre de precision, qui est regie a 28 chiffres 
significatifs par defaut , par le biais des objets Context. 

Un objet Context determine un environnement d'execution. II contient : 

• prec : degre de precision, par defaut a 28 ; 

• rounding : definit le fonctionnement de l'arrondi et peut prendre entre autres 
valeurs : 

- R0UND_CEILING : arrondi superieur ; 

- R0UND_D0WN : arrondi vers zero ; 

- R0UND_FL00R : arrondi inferieur. 

Chaque thread possede un contexte qui peut etre recupere par getcontext() et ecrit 
par setcontext(contexte). 
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Degre de precision 

>» from decimal import Decimal, getcontext 

>» Deci mal ( ' 5 . 9 ' ) /Deci mal ( ' 3 . 4 ' ) 

Decimal ("1.735294117647058823529411765") 

>» getcontext() .prec = 2 

>» Deci mal ( ' 5 . 9 ' )/Deci mal ( ' 3 . 4 ' ) 

Decimal ("1.7") 



cStringlO 



Ce module fournit, comme le module StringlO, une classe StringlO qui imple- 
mente les memes interfaces que le type f i 1 e mais travaille avec une chaine de carac- 
teres en memoire. cStri nglO est une implementation rapide de l'objet Stri nglO. 



class StringlO((buffer)) 

StringlO s'initialise avec un objet string ou Unicode. Cependant, et contrairement a 
Stri nglO . Stri nglO, les methodes de lecture de donnees retournent toujours des objets 
de type stri ng et il est done deconseille de manipuler de l'unicode avec cet objet. 

Toutes les methodes de l'objet sont equivalentes aux objets de type f i 1 e exceptee la 
methode close () qui libere le contenu en memoire. 

Manipulation d'un fichier memoire 

>» from cStringlO import StringlO 

>» donnes = Stri nglOC Repete apres moi : Python est le meilleur 

langage\n'*100000) 

>» print donnes . readline() 

Repete apres moi: Python est le meilleur langage 

>» donnes. seek(0) 

>» fichier = openChypnose.txt', 'w') 

>» f ichier. write (donnes. getvalueO) 

>» fichier. close() 



Utilitaires divers 

Cette section presente une serie de modules utilitaires, a savoir : 

• atexi t : permet de gerer la fin du programme ; 

• pdb : debogueur interactif ; 

• getpass : saisie interactive d'identite ; 
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copy : recopie d'objets ; 

di f f 1 i b : module de comparaison de textes ; 

time et datetime : modules de manipulation de temps ; 

random : module de generation aleatoire. 



atexit 



Le module atexi t fournit une fonction unique qui permet d'empiler des fonctions a 
executer lorsque le programme se termine. Une fois le code principal execute, atexi t 
depile les fonctions de la derniere ajoutee a la premiere. 

Ce mecanisme peut etre pratique pour nettoyer des elements ou pour effectuer des 
sauvegardes en fin d'execution de programme. 

Dans l'exemple ci-dessous, atexi t permet de s' assurer que les threads sont bien tous 
arretes en sortie de programme. 

Nettoyage de threads 

import atexit 

from threading import Thread 
from time import sleep 
from sys import stdout 

class Work(Thread) : 

def run(self) : 
sleep(l) 

def cleanupO : 

for worker in workers: 
stdout. write(' . ') 
worker. join() 
print('\nEnd') 



workers 
if 



[] 



name == main : 

atexit. register (clean up) 

for i in range(lOO): 

workers . append(WorkerO) 

for worker in workers: 
worker. start () 
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pdb 



Python fournit par le biais du module pdb un debogueur interactif qui permet au 
developpeur d'executer le code en mode interactif ou en mode pas-a-pas. 

Le mode pas-a-pas 

Le mode pas-a-pas est disponible nativement dans la plupart des EDI pour les lan- 
gages compiles, et permet d'observer le deroulement du programme en maitrisant 
chaque etape d'execution. Ce mode s' active en inserant des points d'arret, qui sont 
des lignes de code marquees sur lesquelles l'interpreteur s'arrete, pour attendre une 
decision du programmeur. 

Avec pdb, les points d'arret explicites sont definis par un appel a la fonction 
set_trace(). Lorsque l'interpreteur rencontre cette commande, le mode interactif 
est alors enclenche et l'interpreteur se met en attente d'une instruction. 

La commande h ou hel p affiche la liste complete des commandes disponibles. 
Activation du mode pas-a-pas 

>» import pdb 
>» def sub_functionO : 
for i in range(3) : 
print('12') 

>» def main_function() : 
... pdb.set_trace() 

for i in range(2) : 
... sub_function(i) 

>» main_function() 

> <stdin>(3)main_functionO 

(Pdb) h 

Documented commands (type help <topic>): 



EOF break condition disable help list q step w 

a bt cont down ignore n quit tbreak whatis 

alias c continue enable j next r u where 

args cl d exit jump p return unalias 

b clear debug h 1 pp s up 

Miscellaneous help topics: 

exec pdb 
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Undocumented commands: 

retval rv 

(Pdb) 

Le mode interactif de pdb est visualise par le changement de prompt : 
>» devient (Pdb). 

Les commandes disponibles sont : 

• aouargs : affiche les arguments de la fonction en cours, lorsqu'il y en a. 

• ali as [name [command]] : permet d'associer a un nom une sequence de code. Si 
command est omis, alias affiche le contenu de la commande. Si alias est appele 
sans parametres, tous les alias definis sont affiches. Un alias devient une nouvelle 
commande du debogueur (presente en detail a la prochaine section) et il peut ega- 
lement porter le meme nom qu'une commande native et dans ce cas la surcharger. 

• b ou break([file:]lineno | function) [, condition] : permet d'ajouter un 
point d'arret dans le code. II y a deux facons de localiser le code pour la mise en 
place du point d'arret : par numero de ligne avec 1 i neno ou par nom de fonction 
avec function. 

Si le point d'arret est a placer dans un autre fichier, il est possible de prefixer la 
localisation par le nom du fichier suffixe de « : ». 

Enfin, condition est une eventuelle expression, sous la forme d'une chaine de 
caracteres qui est evaluee pour savoir si 1' arret est marque. Une variante de break 
est tbreak, qui est automatiquement retiree apres un premier passage. Si break 
est appelee sans parametre, il liste les points d'arret existants, avec pour chacun un 
numero unique. 

• c ou cont ou continue : relance l'execution de la suite du programme. Le deve- 
loppeur ne recupere la main qu'au prochain point d'arret s'il existe. 

• cl ou clear [bpnumber [bpnumber ...] ] | [ [filename: ]li neno 
[f i 1 ename : ] 1 i neno . . . ] ] : permet de supprimer les points d'arret, en fournissant 
leurs numeros ou leurs localisations. Si aucun parametre n'est fourni, clear sup- 
prime tous les points d'arret definis par break, apres confirmation. 

• condition bpnumber str_condition : permet d'associer au point d'arret de 
numero bpnumber l'expression conditionnelle str_condition. Si cet argument 
n'est pas fourni, le point d'arret n'a plus de condition associee. 

• Debug : permet de lancer un nouveau debogueur, qui s' execute dans l'environne- 
ment du debogueur originel. 

• disable bpnumber [bpnumber ...] : desactive les points d'arret, qui restent 
cependant toujours associes au code. 
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• d ou down : deplace le debogueur d'un niveau plus bas dans la pile d'appel. 

• enable bpnumber [bpnumber ...] : reactive les points d'arret precedemment 
desactives. 

• exit ou q ou quit : quitte le debogueur, puis le programme. 

• h ou hel p : affiche l'ecran d'aide. 

• ignore bpnumber count : associe a un point d'arret un entier positif count. A 
chaque passage sur le point d'arret, cet entier est decremente et 1' arret nest pas 
marque, tant que count n'a pas atteint 0. 

• j ou j umpl i neno : permet de definir la prochaine ligne a executer. 

• 1 ou 1 i st [f i rst [ , 1 ast] ] : affiche le code source entre la ligne f i rst et la ligne 
last du code courant. Si ces parametres ne sont pas fournis, affiche les 11 lignes 
suivantes. Si seul fi rst est fourni, affiche les 11 lignes en partant de fi rst. Enfin, 
si 1 ast est inferieur a f i rst, il est utilise comme le nombre de lignes a afficher. 

• n ou next : execute la ligne courante et s'arrete a la suivante, dans la fonction cou- 
rante. 

• p ou ppexpression : affiche la valeur de 1' expression, pp est une variante qui uti- 
lise le module pprint pour afficher 1' expression en pretty print, c'est-a-dire en 
affichant de maniere lisible et indentee les structures complexes comme les listes 
imbriquees sur plusieurs niveaux. 

• rou return : execute le code jusqu'a la fin de la fonction courante. 

• s ou step : execute la ligne courante et s'arrete a la suivante. Contrairement a 
next, si la ligne executee appelle une autre fonction, step passe alors a la premiere 
ligne de cette fonction. 

• u ou up : deplace le debogueur d'un niveau plus haut dans la pile d'appel. 

• unalias name : supprime 1' alias name. 

• w ou where ou bt : affiche la pile d'appel, du plus haut au plus bas niveau. 

• whati sarg : affiche le type de l'argument arg. 

Exemple de session pas-a-pas 

def sub_function(text) : 
for i in range(3) : 
print(text) 

def main_function() : 
import pdb 
pdb.set_trace() 
for i in range(2) : 
sub_function(str(i)) 
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main_functionO 
[...] 

tziade@Tarek:~/Desktop$ python scripts/debugging.py 

> /home/tzi ade/Desktop/scri pts/debuggi ng . py (9)mai n_f uncti on () 
-> for i in range(2): 

(Pdb) w 

/home/tzi ade/Desktop/scri pts/debuggi ng. py(12)?() 
-> ma_fonction() 

> /home/tzi ade/Desktop/scri pts/debuggi ng . py(9)mai n_f uncti on() 
-> for i in range(2): 

(Pdb) n 

> /home/tzi ade/Desktop/scri pts/debuggi ng . py (10)mai n_f uncti on () 
-> sub_function(str(i)) 

(Pdb) n 







> /home/tzi ade/Desktop/scri pts/debuggi ng . py(9)mai n_f uncti on () 
-> for i in range(2): 

(Pdb) n 

> /home/tzi ade/Desktop/scri pts/debuggi ng . py (10)mai n_f uncti on () 
-> sub_function(str(i)) 

(Pdb) s 
— Call — 

> /home/tzi ade/Desktop/scri pts/debuggi ng. py(2)sub_function() 
-> def sub_function(text) : 

(Pdb) n 

> /home/tzi ade/Desktop/scri pts/debuggi ng. py(3)sub_function() 
-> for i in range(3): 

(Pdb) n 

> /home/tzi ade/Desktop/scri pts/debuggi ng. py(4)sub_function() 
-> print(text) 

(Pdb) whatis text 

<type 'str'> 

(Pdb) c 

1 

1 

1 

Outre ces commandes, le prompt (Pdb) reste un prompt Python tout a fait fonc- 
tionnel et il est possible de l'utiliser pour appeler du code a executer, afficher des 
valeurs, ou effectuer toute autre manipulation. L'environnement d'execution est dans 
ce cas celui de la fonction dans laquelle le debogueur est arrete. 
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Execution de code dans le prompt Pdb 

tziade@Tarek: -/Desktops python scripts/debugging.py python 

> /home/tziade/Desktop/scripts/debugging. py(9)main_functionO 
-> for i in range(2): 

(Pdb) n 

> /home/tzi ade/Desktop/scri pts/debuggi ng . py (10)mai n_f uncti on () 
-> sub_function(str(i)) 

(Pdb) i 



(Pdb) import time 

(Pdb) time.asctimeO 

'Wed Oct 5 13:23:22 2005' 

(Pdb) (next) = 12 

(Pdb) print next 

12 

(Pdb) next 







> /home/tzi ade/Desktop/scri pts/debuggi ng. py(9)main_function() 
-> for i in range(2): 

(Pdb) c 

1 

1 

1 

La seule precaution dans 1' execution de code est de garnir de parentheses les variables 
portant le meme nom qu'une commande pdb ou un alias, afin d'eviter une collision 
de noms au moment de l'interpretation, comme dans le cas de next ci-dessus. 



Alias et fichier .pdbrc 

Au premier chargement de pdb, si un fichier nomme .pdbrc se trouve dans votre 
repertoire personnel (variable HOME dans les variables d'environnement de votre sys- 
teme) ou dans le repertoire courant, il est interprete par le debogueur et peut contenir 
des commandes pdb. 

Ce fichier permet de creer des macros de commandes, associees a des alias, pour ne 
pas avoir a les retaper a chaque session de debogage. 

Exemple de fichier .pdbrc 

# fichier d' alias pour pdb 
print("alias charges") 

# affiche la liste des variables de 1 'instance objet 
alias obvars pp %1. diet 
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# determine si 1 'instance passee est une new-style cass 
alias nsc issubclass(%l. class , object) 

Les commandes peuvent recuperer des parametres en entree, suivant le modele des 
scripts shell : %1 est le premier parametre, %2 le second, etc. %* renvoie tous les para- 
metres, a l'image de *args. Les commandes peuvent bien sur utiliser d'autres alias 
s'ils ont ete definis avant. 

Utilisation des alias 

>» class T(object): 

def init (self): 

self.t = 12 

>» t = T() 

>» import pdb; pdb.set_trace() 

--Return-- 

alias charges 

> <stdin>(l)?()->None 

(Pdb) obvars t 

{'t': 12} 

(Pdb) nsc t 

True 



Le mode post mortem 

Le mode post mortem, comme son nom l'indique, permet d'utiliser pdb apres la mort 
du programme. En d'autres termes, lorsque le programme leve une exception, il est 
possible d'etudier la derniere pile d'appel, et meme de remonter les niveaux. Ce mode 
s'obtient par la fonction pm(). 

Le retour du code vivant 

def sub_function(texte) : 
for i in range(3) : 

raise TypeError('aff reux plantage') 
print(text) 

def main_function() : 
for i in range(2) : 
sub_function(str(i)) 

>» from debugging import ma_fonction 
>» main_function() 
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Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
File "debugging.py" , line 9, in main_f unction 

sub_function(str(i)) 
File "debugging.py", line 4, in sub_f unction 
raise TypeError('aff reux plantage') 
TypeError: affreux plantage 
>» import pdb;pdb.pm() 
alias charges 

> /home/tziade/Desktop/scripts/debugging. py(4)sub_function() 
-> raise TypeError('aff reux plantage') 

(Pdb) i 



(Pdb) up 

> /home/tziade/Desktop/scripts/debugging. py(9)main_function() 
-> sub_function(str(i)) 

(Pdb) 1 

4 raise TypeError('aff reux plantage') 

5 print(text) 
6 

7 def main_function() : 

8 for i in range(2) : 

9 -> sub_function(str(i)) 
(Pdb) 



getpass 

Le module getpass recupere par le biais de la fonction getpass () un mot de passe de 
maniere interactive. II se base sur les bibliotheques disponibles du systeme hote pour 
faire cette demande, soit : 

• avec msvcrt sous MS-Windows ; 

• avec EasyDialogs.AskPassword sous Mac ; 

• dans le terminal, avec le mode echo a off, sous Unix. 

getpass fournit aussi une fonction getuser(), qui renvoie le nom de i'utilisateur 
courant, en le recherchant dans les variables d'environnement du systeme (respecti- 
vement LOGNAME, USER, LNAME et USERNAME). 

getpass a I'usage 

>» import getpass 
>» getpass. getuser() 

'tziade' 

>» getpass. getpassC Entrez un mot de passe :') 

Entrez un mot de passe : 

'unmotdepasse' 



copy 
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copy fournit deux fonctions, copyO et deepcopyO, qui permettent de recopier le 
contenu d'un objet dans un clone. La premiere effectue une shallow copy et la seconde 
une deep copy. 

Une shallow copy cree un second objet et y recopie les liens vers les objets qui com- 
posent les attributs de l'objet originel. En d'autres termes, ces deux objets partagent 
les memes attributs en memoire. 

Une deep copy, quant a elle, recopie completement les objets. Le nouvel objet 
devient done totalement independant. 

copy, comme pickle, est basee sur une lecture de diet . Elle est done reservee 

aux manipulations d'instances de donnees et ne permet pas de recopier les objets de 
types fonctionnels comme : 

• les modules ; 

• les classes ; 

• les fonctions ; 

• les fichiers ; 

• les sockets, ... 

copyO et deepcopyO sont dans un bateau 

>» class T(object): 

def init (self): 

self.t = [1, 2] 

>» t = T() 

>» from copy import copy, deepcopy 

>» t2 = copy(t) 

>» t2.t 

[1, 2] 

>» t2 .t.append(3) 

>» t2.t 

[1, 2, 3] 

>» t.t 

[1, 2, 3] 

>» t3 = deepcopy(t) 

>» t3 .t.append(4) 

>» t3.t 

[1, 2, 3, 4] 

>» t.t 

[1, 2, 3] 
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difflib 



Le module difflib fournit un certain nombre d'utilitaires pour comparer deux 
textes. Les fonctionnalites sont equivalentes a ce que des outils de versioning comme 
CVS ou SVN peuvent fournir. 

di f f 1 i b offre des fonctions pour : 

• afficher les differences entre deux textes ; 

• restaurer un texte avec les differences. 



Affichage des differences 

Les fonctions context_diff () et unified_diff () calculent les differences entre les 
deux textes passes en parametres sous forme de listes de lignes, et renvoient un 
generator qui contient le texte des differences. 

Pour chaque sous-partie de texte qui contient une difference, context_diff() ren- 
voie un bloc prefixe des numeros des lignes concernees dans le texte, avec la version 1 
suivie de la version 2. 

unified_diff () quant a elle regroupe les differences dans un meme texte. 
Comparaison de textes 

>» text_l = """ 

... Lorsque les mouette volent a basse altitude, 

... II faut se mefier du temps qu'il fera demain. 

. . . Car 1 'adage dit: 

... "Mouette basse, orage haut" 

>» text_2 = """ 

... Lorsque les mouettes volent a basse altitude, 

... II faut se mefier du temps qu'il fera le lendemain. 

. . . Car 1 'adage dit: 

... "Mouette basse, orage haut" 

... (Auteur: ???) 

. . . 5/20 

>» text_l = text_l. splitlines(l) 

>» text_2 = text_2 . splitlines(l) 

>» res = difflib. context_diff (text_l, text_2) 

>» printC ' . join(list(res))) 



i * * * * * * * * * **** 

•* 1,6 **** 
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! Lorsque les mouette volent a basse altitude, 
! II faut se mefier du temps qu'il fera demain. 

Car 1 'adage dit: 

"Mouette basse, orage haut" 
— 1,8 



Lorsque les mouettes volent a basse altitude, 



! II faut se mefier du temps qu'il fera le lendemain. 

Car 1 'adage dit: 

"Mouette basse, orage haut" 
+ (Auteur: ???) 
+ 5/20 

>» res = difflib.unified_diff (text_l, text_2) 
>» print(' ' . join(list(res))) 

+++ 

@@ -1,6 +1,8 @@ 

-Lorsque les mouette volent a basse altitude, 
-II faut se mefier du temps qu'il fera demain. 
+Lorsque les mouettes volent a basse altitude, 
+11 faut se mefier du temps qu'il fera le lendemain. 

Car 1 'adage dit: 

"Mouette basse, orage haut" 
+(Auteur: ???) 
+5/20 

Chaque ajout ou retrait de texte est signifie par les caracteres +, - ou ! selon les cas. 
L'interpretation des resultats reste cependant relativement difficile car les lignes sont 
signalees differentes mais sans plus de detail, et un post-traitement est necessaire 
pour ne pas avoir a rechercher les ecarts. 

La classe Di f f e r joue ce role, en se placant au-dessus de ces fonctions. Elle fournit une 
fonction compare () qui affiche le resultat avec plus de precision: chaque caractere 
ajoute, supprime, ou modifie est notifie par un caractere +, - ou a, place sur une ligne 
dediee. Differ.compareO peut aussi etre appelee directement par la fonction ndiff (). 

Utilisation de Differ 

>» from difflib import Differ, ndiff 

>» res = DifferO . compare (text_l, text_2) 

>» print ' ' . join(list(res)) 
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- Lorsque les mouettes volent a basse altitude, 
? 

+ Lorsque les mouettes volent a basse altitude, 
? + 

- II faut se mefier du temps qu'il fera demain. 

+ II faut se mefier du temps qu'il fera le lendemain. 
? ++++++ 

Car 1 'adage di t : 

"Mouette basse, orage haut" 
+ (Auteur: ???) 
+ 5/20 

>» res = ndiff (text_l, text_2) 
>» print(' ' . joi n(li st(res))) 

- Lorsque les mouettes volent a basse altitude, 
? 

+ Lorsque les mouettes volent a basse altitude, 
? + 

- II faut se mefier du temps qu'il fera demain. 

+ II faut se mefier du temps qu'il fera le lendemain. 
? ++++++ 

Car 1 'adage di t: 

"Mouette basse, orage haut" 
+ (Auteur: ???) 
+ 5/20 



Restauration 

Les differences renvoyees par les fonctions precedentes peuvent etre utilisees pour 
offrir des fonctions de restauration. Le texte renvoye par ndiff () contient toutes les 
informations necessaires pour reconstruire les deux textes compares. 

difflib fournit pour cette operation la fonction restoreO qui prend en premier 
parametre les differences issues d'un appel a ndiff () ,Differ() ou compareO, et en 
deuxieme parametre un entier qui definit quel texte doit etre renvoye. Pour une dif- 
ference issue d'une comparaison ndiff (a, b), si 1 est fourni en deuxieme parametre 
de restoreO, c'est a qui est renvoye. Si 2 est fourni, c'est b qui est renvoye. 

Restauration 

>» diffs = ndiff (text_l, text_2) 

>» diffs = list (diffs) 

>» from difflib import restore 

>» rtext_l = restore(diffs, 1) 

>» rtext_l = list(rtext_l) 
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>» rtext_2 = restore(diffs, 2) 
>» rtext_2 = list(rtext_2) 
>» print(' ' . join(rtext_l)) 

Lorsque les mouette volent a basse altitude, 
II faut se mefier du temps qu'il fera demain. 

Car 1 'adage dit: 

"Mouette basse, orage haut" 

>» print(' ' . join(rtext_2)) 

Lorsque les mouettes volent a basse altitude, 

II faut se mefier du temps qu'il fera le lendemain. 

Car 1 'adage dit: 

"Mouette basse, orage haut" 
(Auteur: ???) 
5/20 



time 



Le module time fournit des fonctions de manipulation de temps, base sur deux 
representations differentes : le temps ecoule depuis Y Epoch, et le temps UTC (Coor- 
dinated Universal Time). 

Epoch 

L'Epoch correspond a une date particuliere, fixee par le systeme, qui est la date de 
reference a partir de laquelle le temps est compte en secondes ecoulees. Cette date est 
fixee au ler Janvier 1970 sur la plupart des systemes et est representee en Python sous 
la forme d'un reel. 



UTC/GMT 

L'TJTC (Universal Time Coordinate), ou Greenwich Mean Time represente quant a lui 
le temps sous la forme d'une date complete et est represente en Python sous la forme 
d'un tuple compose d'entiers : 

• l'annee (entre 1 et 9999) ; 

• le mois (1-12) ; 

• lejour (1-31) ; 

• l'heure (0-23) ; 

• les minutes (0-59) ; 
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• les secondes (0-59) ; 

• le jour de la semaine (0-6) ; 

• le jour de I'annee (1-366) ; 

• DST : un drapeau pour l'heure d'ete (-1, ou 1). 

Le temps UTC courant renvoye par localtime() 

>» import time 

>» time.localtime() 

(2009, 3, 8, 1, 56, 11, 5, 281, 1) 

Lorsque le drapeau DST vaut 1, le temps renvoye est ajuste en fonction de l'heure 
d'ete ou d'hiver. Pour 0, le temps est conserve sans modification. 

Fonctions de manipulation 

Les fonctions fournies par time sont : 

• asctime([utc]) : convertit le temps UTC en sa representation string. Si utc 
nest pas fourni, asctime() utilise le temps courant. Cette fonction ne controle 
pas la coherence calendaire des donnees fournies : si le jour de la semaine fourni 
ne correspond pas au jour de I'annee fournie, aucune erreur n'est levee. 

• clock() : renvoie le temps cpu pris par le processus courant depuis son demar- 
rage. Cette methode est tres precise (de l'ordre de la microseconde) . 

• cti me ([seconds]) : renvoie, sous forme de string, la representation UTC des 
secondes depuis Epoch definies par seconds. Si seconds n'est pas fourni, le nom- 
bre de secondes courant est utilise. 

• gmti me ([seconds]) : convertit le temps seconds, ecoule depuis Epoch, en sa 
representation UTC. Si seconds n'est pas fourni, le nombre de secondes courant 
est utilise. Ne gere pas le drapeau DST. 

• local time ([seconds]) : comme gmttime() mais gere le drapeau DST. 

• mktime(utc) : convertit le temps UTC en secondes depuis Epoch. 

• sleep(seconds) : place l'interpreteur en attente pendant le nombre de secondes 
fournies sous forme de f 1 oat. 

• time() : renvoie le temps en secondes ecoulees depuis Epoch. 

Manipulation de dates 

>» import time 
>» time.timeO 
1128869880.906467 
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>» time.localtimeO 

(2005, 10, 9, 16, 47, 33, 6, 282, 1) 

>» time.asctime((1976, 12, 24, 12, 10, 0, 4, 360, 0)) 

'Fri Dec 24 12:10:00 1976' 

>» date_epoch = time.mktime((1976, 12, 24, 12, 10, 0, 4, 360, 0)) 

>» date_epoch 

220273800.0 

>» time.ctime(date_epoch) 

'Fri Dec 24 12:10:00 1976' 

>» time.gmtimeO 

(2005, 10, 9, 14, 49, 35, 6, 282, 0) 



Formatage des dates 

Pour pouvoir afficher les dates sous un format particulier, time fournit la fonction 
st rfti me (format, utc), qui renvoie une date sous la forme d'une chaine de carac- 
teres, en appliquant le formatage fourni. 

Le fonctionnement est similaire au formatage des chaines classiques, et se base sur 
un ensemble de directives dediees, a savoir : 





Tableau 9-1 Directives de formatage 


des dates 




Directive 


Description 


Exemple 




%a 


Renvoie I'abrevation locale du jour. 


>» st rfti me ('%a' 
'Sun' 


gmtimeO) 


%A 


Comme %a mais nom complet. 


>» strftime('%A' 
'Sunday' 


gmtimeO) 


%b 


Renvoie I'abreviation locale du mois. 


>» strftime('%b' 
'Oct' 


gmtimeO) 


%B 


Equivalente a %b, sans abreviation. 


>» strftime('%B' 
'October' 


gmtimeO) 


%c 


Renvoie une representation locale complete. 


>» strftime('%c' 
'Sun Oct 9 15:17:' 


gmtimeO) 
\0 2008' 


%d 


Renvoie le jour du mois. 


>» strftime('%d' 
'09' 


gmtimeO) 


%H 


Renvoie I'heure au format 24h. 


>» strftime('%H' 
'15' 


gmtimeO) 


%l 


Renvoie I'heure au format 1 2h. 


>» strftime('%I' 
'03' 


gmtimeO) 


%j 


Renvoie le jour de I'annee. 


>» strftime('%j' 
'282' 


gmtimeO) 


%m 


Renvoie le mois de I'annee, en version numerique. 


>» strftime('%m' 
'10' 


gmtimeO) 
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Tableau 9-1 Directives de formatage des dates (suite) 



Directive 


Description 


Exemple 




%M 


Renvoie les minutes. 


>» strftime('%M' 
'24' 


gmtimeO) 


%p 


Renvoie AM ou PM, en fonction de I'heure. 


>» strftime('%p' 
'PM' 


gmtimeO) 


%S 


Renvoie les secondes. 


>» strftime('%S' 
'34' 


gmtimeO) 


%U 


Renvoie le numero de semaine, en se basant sur le dimanche 
comme premier jour de la semaine. 


>» strftime('%U" 
■41' 


gmtimeO) 


%w 


Renvoie le jour de la semaine sous forme numerique (0 cor- 
respond a Dimanche) 


>» strftime('%w' 
'0' 


gmtimeO) 


%W 


Comme %U mais Lundi est pris en reference comme premier 
jour de la semaine. 


>» strftime('%W' 
'40' 


gmtimeO) 


%x 


Comme %c mais version courte sans jour ni heure. 


>» strftime('%x' 
'10/09/08' 


gmtimeO) 


%X 


Renvoie la representation locale de I'heure. 


>» strftime('%X' 
'15:31:33' 


gmtimeO) 


%y 


Renvoie les deux derniers chiffres de I'annee. 


>» strftime('%y' 
'05' 


gmtimeO) 


%Y 


Renvoie I'annee. 


>» strftime('%Y' 
'2008' 


gmtimeO) 


%Z 


Renvoie la timezone. 


>» strftime('%Z' 
'CET' 


gmtimeO) 


L 


operation inverse est possible grace a la foncti 


on strptime(string 


[, format]), 



qui transforme la date passee sous la forme d'une chaine de caractere en date UTC. 
Si le format n'est pas specifie, '%a %b %d %H:%M:%S %Y' est utilise par defaut. 

Transformation inverse 

>» from time import strftime, strptime, gmtime 

>» temps = strftime('%c' , gmtimeO) 

>» temps 

'Sun Oct 9 21:21:42 2005' 

>» strptime(temps) 

(2005, 10, 9, 21, 21, 42, 6, 282, -1) 



A SAV0IR Changer la localisation 

Dans les exemples precedents, toutes les dates sont en anglais car la machine utilisee est installee dans 
cette langue. II est possible d'influer sur ce parametrage depuis Python, par le biais du module 1 ocal e, 
en modifiant par code les parametres locaux. 
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datetime 



datetime complete le module time en fournissant des objets de plus haut niveau, 
soit : 

• une classe date, pour gerer les dates sans heures ; 

• une classe datetime, pour gerer les dates avec heures ; 

• une classe time, pour gerer les heures simples ; 

• une classe timedelta, pour gerer les ecarts de temps entres instances des classes 
precedentes. 

class timedelta(weeks, days, minutes, hours, seconds, microsecondes, 
milliseconds) 

La classe timedelta sert a representer une duree. 

Les instances de cette classe supportent entre elles l'addition, la soustraction, le chan- 
gement de signe et l'operateur abs(), et peuvent etre utilisees dans des operations 
avec les classes time, date et datetime. 

Operations ferroviaires 

>» from datetime import timedelta, datetime 

>» tgv_di jon_paris = timede~lta(hours=l, minutes=40) 

>» tgv_di jon_paris 

datetime.timede"lta(0, 6000) 

>» # 10 minutes de retard 

>» tgv_di jon_paris + timedelta (mi nutes=10) 
datetime.timedelta(0, 6600) 
>» # 5 mn d'avance (!) 

>» tgv_di jon_paris - timedelta (mi nutes=5) 

datetime.timedelta(0, 5700) 

>» - tgv_di jon_paris 

datetime. timedelta(-l, 80400) 

>» abs(-tgv_di jon_paris) 

datetime.timedelta(0, 6000) 

>» # calcul trajet 

>» depart = datetime. now() 

>» depart .ctime() 

'Mon Oct 10 11:59:11 2005' 

>» arrivee = depart + tgv_di jon_paris 

>» arrivee. ctime() 

'Mon Oct 10 13:39:11 2005' 
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class date 

La classe date represents une date et est instanciee avec un jour, un mois et une 
annee. Ces informations se retrouvent ensuite comme attributs de l'objet. 

Creation d'objets date 

>» from datetime import date 

>» date (2004, 12, 3) 

datetime. date(2004, 12, 3) 

>» my_date = date(2004, 12, 3) 

>» my_date.year 

2004 

>» my_date. month 

12 

>» my_date.day 

3 

Les valeurs possibles pour les instances de date sont bornees par deux constantes 
definies dans le module, a savoir MINYEAR et MAXYEAR. 

Fourchette des dates possibles 

>» import datetime 

>» datetime. MINYEAR 

1 

>» datetime. MAXYEAR 

9999 

>» # date la plus petite 

>» datetime. date (datetime. MINYEAR, 1, 1) 
datetime. date(l, 1, 1) 
>» # date la plus grande 

>» datetime. date (datetime. MAXYEAR, 12, 31) 
datetime. date (9999, 12, 31) 

date fournit egalement des methodes de classe qui permettent d'instancier des objets 
particuliers, a savoir : 

• todayO : renvoie un objet date pour la date courante. 

• fromtimestamp(seconds) : renvoie un objet date pour la date correspondant au 
nombre de secondes ecoulees depuis Epoch. 

• fromordinal (ordinal) : renvoie un objet date pour la date correspondante au 
nombre de jours ecoules depuis la plus petite date possible. 
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Methodes de classe de date 

>» dateti me. date. today () 

dateti me. date (2009, 3, 1) 

>» dateti me . date . f romti mestamp (270000000) 

dateti me. date (1978, 7, 23) 

>» dateti me. date, f romordinal (7) 

dateti me. date (1, 1, 7) 

Les methodes d'instances permettent de manipuler la date et utilisent en interne les 
fonctions fournies par le module time : 

• str () : renvoie une representation sous forme de chaine de caracteres, calcu- 

lee par isoformat(). 

• cti me () : similaire a date . cti me () pour la date. 

• isoweekdayO : renvoie le numero de semaine, avec lundi en reference {calendrier 
ISO 8601). 

• isocalendarO : renvoie un tuple (annee, numero de semaine, numero de jour). 

• i soformatO : renvoie la date au format ISO 8601. 

• replace (year, month, day) : renvoie une instance de date, en appliquant au 
prealable une modification sur les valeurs. Chacun des parametres de remplace- 
ment est optionnel. 

• strftime(format) : appelle la fonction time. strf time () pour la date. 

• timetupl e(): renvoie la date au format UTC. 

• toordi nal () : convertit la date en nombre de jours ecoules depuis la date mini- 
male. 

• weekday () : renvoie le jour de la semaine, avec lundi = 0. 



A SAV0IR La norme ISO 8601 

Le calendrier utilise pour les methodes prefixees de « iso » est base sur la norme ISO 8601 , qui definit les 
regies suivantes : 

• lundi est le premier jour de la semaine et vaut 1 . 

• dimanche est le dernier jour de la semaine et vaut 7. 

• La premiere semaine de I'annee est la premiere semaine contenant un jeudi. 



Manipulation de date 

>» my_date = dateti me. date(1976, 12, 24) 

>» str(my_date) 

'1976-12-24' 
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>» my_date.ct"ime() 

'Fri Dec 24 00:00:00 1976' 

>» my_date.isocalendar() 

(1976, 52, 5) 

>» my_date.toordinal () 

721712 

>» my_date. replace(day=28) 

datetime.date(1976, 12, 28) 

class time 

La classe time gere une heure, construite avec les elements suivants : 

• heures (de a 23) ; 

• minutes (optionnel, de a 59) ; 

• secondes (optionnel, de a 59) ; 

• microsecondes (optionnel, de a 999 999) ; 

• tzinfo (optionnel). 

tzi nf o est une instance de la classe de base tzi nfo fournie par le module, qui permet de 
definir des regies particulieres sur l'heure, comme le decalage heure d'ete/heure d'hiver, 
ou 1'information de zone locale (Europe/Berlin, Europe/Paris, Australia/Sidney, etc.). 

La classe tzi nfo ne peut pas etre instanciee directement et ses methodes necessitent 
d'etre implementees dans des classes concretes. 

Un objet tzinfo doit fournir trois methodes : 

• tznameO : le nom de la zone qui sera utilise dans les affichages. 

• utcoffset(dt) : renvoie le decalage de zone a appliquer a dt, exprime en objet de 
type timedelta. 

• dst(dt) : renvoie le decalage heure d'ete/heure d'hiver, a appliquer a dt, exprime 
en objet de type timedelta. 

Implementation de tzinfo pour Paris 

#! /usr/bi n/python 

• -*- coding: utf8 -*- 

from time import altzone, timezone, mktime, local time 
from datetime import tzinfo, timedelta, datetime 

class TZParis(tzinfo) : 

def init (self) : 

self .ofsset_summer = timedelta(seconds=-altzone) 
self .ofsset_zone = timedelta(seconds=-timezone) 
self.ofsset = self .ofsset_summer - self .ofsset_zone 
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def _dt_local(self, dt) : 

"""Determine la nature de 1'objet datetime fourni.""" 

# ne peut utiliser timetuple() ici car 

# provoquerait un appel recursif sans fin 
tuple_ = (dt.year, dt. month, dt.day, dt.hour, 

dt. minute, dt. second, dt.weekdayO , 0, -1) 
return localtime(mktime(tuple_)) . tm_isdst > 

def utcoffset(self , dt) : 
if self, dt local(dt): 

return self .ofsset_summer 
else: 

return self. ofsset zone 

def tzname(self, dt) : 

return "Europe/Paris" 

def dstCself, dt) : 

if self, dt local (dt): 

return self .decalage 
else: 

return timedelta(O) 

if name == ' main ' : 

# exemple d' utilisation 

my_date = datetime(1976, 12, 24, 12, 00, 00, tzinfo=TZParis()) 

print (my_date . i soformat ()) 

tziade@Tarek:~/Desktop/scripts$ python timezone.py 
1976-12-24T12 : 00 : 00+01: 00 

Les methodes de manipulation fournies par la classe time sont : 

str () : renvoie le resultat de la methode i soformat(). 

dst() : renvoie tzinfo.dst(None) si tzinfo a ete defini. Renvoie None dans le 

cas inverse. 

isoformat(): renvoie une chaine de caracteres representant l'heure au format 

ISO 8601. 

replace(hour , minute, second, microsecond, tzinfo) : renvoie une instance 

de time, apres avoir remplace les elements fournis. Chaque element est optionnel. 

UtcoffsetO : renvoie tzinfo. utcoff set (None) si tzinfo a ete defini. Renvoie 

None dans le cas inverse. 

TznameO : renvoie tzinfo.tzname() si tzinfo a ete defini. Renvoie None dans le 

cas inverse. 
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class datetime 

datetime est en quelque sorte une combinaison des classes date et time. Cette classe 
fournit la plupart des methodes des deux classes precedentes et quelques methodes 
supplementaires, comme la methode combi ne () . combi ne (date , ti me) fusionne un 
objet date et un objet time en objet datetime. 

Date importante 

>» from datetime import date, time, datetime 

>» my_date = datetime(2005 , 12, 21) 

>» my_time = time (20, 50) 

>» the_date = datetime (2005, 12, 21) 

>» print('\nRediffusion de Columbo "le Milliardaire psychopathe" ' 

... 'sur France l\n %s ' 

... % the_date. combi ne(my_date, my_time) .ctime() 

Rediffusion de Columbo "le Milliardaire psychopathe" sur France 1 
Wed Dec 21 20:50:00 2005' 



random 

Le module random fournit des fonctions de generation de valeurs pseudo-aleatoires, 
basees sur une implementation en C de l'algorithme deterministe Mersenne Twister. 

Les fonctions les plus couramment utilisees sont : 

• choice(sequence) : renvoie un element au hasard de la sequence fournie. 

• randi nt(a, b) : renvoie un nombre entier compris entre a et b. 

• random () : renvoie un reel compris entre 0.0 et 1.0. 

• sample(sequence, k) : renvoie k elements uniques de la sequence. 

• seed([salt]) : initialise le generateur aleatoire. 

• shuffle (sequenced random]) : melange l'ordre des elements de la sequence 
(dans l'objet lui-meme). Si random est fourni, c'est un callable qui renvoie un reel 
entre 0.0 et 1.0. random() est pris par defaut. 

• uniform(a, b) : renvoie un reel compris entre a et b. 

Correction copies 

>» import random 

>» good_work = ['Excellent travail!', 
... 'Tres bonne analyse', 

... 'Les resultats sont la !'] 

>» bad_work = ["J'ai gratte la copie pour mettre des points", 
... 'Vous filez un mauvais coton', 

'Que se passe-t-il ?'] 
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>» ok_work = ['Bonne premiere partie mais soignez la presentation', 
... 'Petites erreurs, dommage !', 

'Des progres'] 
>» class Work(object) : 

... def init (self, student): 

... self. student = student 

... self .auto_corrector() 

... def auto_corrector(self) : 

... self. note = random. randint(l, 20) 

... if self .note < 8: 

... self .appreciation = random. choice (bad_work) 

... el if self. note < 14: 

... self .appreciation = random. choice (ok_work) 

... el se : 

... self .appreciation = random. choice (good_work) 

def str (self): 

... return '%s: %s , %s' %(self .student, self. note, 
self .appreciation) 

>» students = ['Bernard', 'Robert', 'Rene', 'Gaston', 
... 'Eglantine', 'Aime', 'Robertine'] 

>» works = [Work(student) for student in students] 
>» for work in works: 
print work 

Bernard: 20, Tres bonne analyse 

Robert: 13, Des progres 

Rene: 1, Vous filez un mauvais coton 

Gaston: 13, Des progres 

Eglantine: 20, Tres bonne analyse 

Aime: 2, 1'ai gratte la copie pour mettre des points 

Robertine: 11, Petites erreurs, dommage ! 



En un mot... 



Les modules presentes dans ce chapitre fournissent des outils de programmation qui 
peuvent etre utilises dans des applications variees. 

Le chapitre 10 complete cette collection par la presentation de quelques modules 
additionnels : itertools, re, Tkinter et lib2to3. 



10 



Principaux modules, partie 3 



Ce chapitre termine la presentation des principaux modules par : 

• itertools : utilitaires pour iterateurs; 

• re : module sur les expressions regulieres ; 

• tki nter : module de creation d'interfaces Tk ; 

• Li b2to3 et 2to3 : scripts de conversion de code Python 2 vers Python 3. 



Le module itertools 

Ce module fournit des fonctions rapides pour generer des iterateurs, et remplacer 
directement certaines primitives comme map(), filterO , reduce () et zip(). 

chain(*iterables) -> iterateur 

chain () renvoie un iterateur compose de tous les elements fournis dans les iterables 
passes en parametre. 

chai n concatene des iterables par exemple dans une boucle. 
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Composition par chaine 

>» from itertools import chain 

>» seql = [1, 2, 3] 

>» def seq2() : 

... return (a for a in [4, 5]) 

>» for elm in chain(seql, seq2()): 
print elm 



count((premier_entier)) -> iterateur 

Retourne un iterateur qui renvoie des entiers incrementes par pas de 1. Si 
premi er_enti er est fourni, il est le premier entier renvoye. Sinon count () utilise 0. 

Un compteur 

>» import itertools 

>» iter = itertools .count(lO) 

>» [iter.nextO for i in range(5)] 

[10, 11, 12, 13, 14] 

Cet iterateur est pseudo-infini : une fois sys.maxint atteint, il continue sur des 
valeurs de type long sous Python 2. 

D'int a long 

>» import sys 

>» iter = itertools .count(sys.maxint-l) 

>» iter.nextO 

2147483646 

>» iter.nextO 

2147483647 

>» iter.nextO 

2147483648L 

>» iter.nextO 

2147483649L 



cycle(iterable) -> iterateur 

Renvoie un iterateur qui parcourt indefiniment les elements de l'iterable. 
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Cycle infini 

>» import itertools 

>» iter = itertools. cycle('abc') 

>» [iter.nextO for "i in range(8)] 

['a', 'b', 'c', 'a', 'b', 'c', 'a', 'b'] 

Au premier passage, chaque element parcouru est sauvegarde en interne, puis l'itera- 
teur boucle indefiniment sur les elements sauvegardes. 

La memoire maximum utilisee par cette fonction est done le double de la taille de 
l'iterable passe en parametre. 

drop while(predi cat, iterable) -> iterateur 

Fournit un iterateur qui fonctionne en deux temps : 

• il parcourt les elements de l'iterable et envoie chaque element au callable 
predicat. La boucle s'arrete des que predicat renvoie False ou que la sequence 
se termine. Dans le cas ou predicat renvoie False, I'element declencheur est le 
premier renvoye par l'iterateur. 

• II fournit ensuite un iterateur classique sur tous les elements suivants de la boucle. 

Declencheur 

>» import itertools 

>» def watcher(element) : 

... return element != "e'est lui!" 

>» iter = itertools. dropwhile(watcher, 

... ["e'est moi " , "e'est eux", 

... "e'est lui!", "e'est nous"]) 

>» iter.nextO 

"e'est lui ! " 

>» iter.nextO 

"e'est nous" 

>» iter.nextO 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module>? 
Stoplteration 

Cette forme d'iterateur permet de travailler avec une sous-sequence. 

groupby(iterable[, keyfunc)) -> iterateur 

Renvoie un iterateur qui recupere des couples (cle, groupe). keyfunc est une fonc- 
tion qui doit renvoyer la cle pour I'element courant. groupe est un iterable qui reunit 
les elements regroupes par cle. 
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Regroupement 

>» import itertools 

>» def odd_even (element) : 

if element % 2 == 0: 
return ' pai r ' 

return 'impai r ' 

>» for key, group in itertools.groupby([2 , 7, 68, 3, 6], odd_even) : 
print('%s: %s' % (key, str(list(group)))) 

pair: [2] 
impair: [7] 
pair: [68] 
impair: [3] 
pai r : [6] 



ifilter(predicat, iterable) -> iterateur 

Renvoie un iterateur qui contient les elements de l'iterable fourni, lorsque le callable 
predi cat renvoie vrai. 

Si predi cat vaut None, les valeurs sont testees avec bool (). 
Filtre sur iterator 

>» import itertools 

>» elements = [1, 2, 3, 4, 5, 6] 

>» def filter(element) : 

... return element % 2 == 

>» filtered = itertools. if ilter(filter, elements) 
>» list (filtered) 
[2, 4, 6] 



ifilterfalse(predicate, iterable) -> iterateur 

Fonction inverse de ifilter(). 
Filtre sur iterator 



>» import itertools 

>» elements = [1, 2, 3, 4, 5, 6] 

>» def filter(element) : 

... return element % 2 == 

>» filtered = itertools.ifilterfalse(filter, elements) 
>» list (filtered) 
[1, 3, 5] 
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imap(fonction, "iterables) -> iterateur 

Renvoie un iterateur qui appelle fonction avec les elements des iterables fournis, 
concatenes pour former la liste des parametres. 

Si fonction vaut None, renvoie les parametres prepares. 
Appels en cascade 



>» import itertools 
>» def sum(a, b, c) : 
return a + b + c 

>» iter = itertools.imap(sum, [1, 2, 3], [4, 5, 6], [7, 8, 9]) 
>» list (iter) 
[12, 15, 18] 



islice(iterable, (start,) stop [, step)) -> iterateur 

Renvoie un iterable qui est une sous-sequence de l'iterable fourni. start, stop et 
step s'utilisent comme les tranches. 

Tranche d'iterable 



>» import itertools 

>» iter = itertools.islice([l, 2, 3, 4], 2, 4) 

>» list (iter) 

[3, 4] 



izip (iterables) -> iterateur 

Fonctionne comme zip(), pour agreger les elements des iterables fournis. 
Combinaisons de sequences 



>» import itertools 

>» iter = itertools.izip(['a' , 'b', 'c'], [1, 2, 3], ['A', 'B', 'C']) 

>» list (iter) 

[('a', 1, 'A'), ('b', 2, 'B'), C'c', 3, 'C')] 

Lorsque les iterateurs sont de longueurs differentes, i zi p s'arrete des que l'iterateur le 
plus petit est consomme. 
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izip_longest(*iterables, (fillvalue=None)) -> iterateur 

izip_longest est une variation d'izip, qui continue tant que tous les iterateurs ne 
sont pas vides. Lorsqu'un iterateur ne fournit plus d'elements, c'est f i 1 1 val ue qui est 
utilise. Par defaut, il est a None. 

Combinaisons de sequences avec izipjongest 



>» import itertools 

>» "iter = itertools .izip_longest('abc' , 'def , 'g', 'hijk') 

>» list(iter) 

[('a', 'd', 'g', 'h'), ('b', 'e', None, 'i'), ('c', 'f , None, 

(None, None, None, 'k')] 

>» "iter = itertools .izip_longest('abc' , 'def, 'g' , 'hijk', 

fill val ue='z') 
>» list (iter) 

[('a', 'd', 'g', 'h'), ('b', 'e', 'z', 'i'), 
('c', 'f , 'z', 'j'), ('z', 'z', 'z', 'k')] 



'J'), 



repeat (element, nb_occurences) -> iterateur 

Genere un iterateur qui repete element nb_occurences fois. Si nb_occurences n'est 
pas fourni, devient un iterateur infini qui renvoie toujours element. 

3 fois 3 



>» import itertools 

>» iter = itertools . repeatC 3' , 3) 

>» list(iter) 

['3', '3', '3'] 



starmap(fonction, sequence) -> iterateur 

Comparable a imap() mais le deuxieme argument doit etre une sequence de tuples. 
A chaque iteration n, l'iterateur renvoie le resultat de fonction(*sequence[n]). 

Tuples prets a I'emploi 



>» import itertools 
>» def fonc("-elements) : 
... print(str(elements)) 

>» st = itertools. starmap(fonc, [('a',), (1, 2), (None,)]) 

>» st. next () 

('a',) 
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>» st.nextO 

CI, 2) 

>» st.nextO 

(None,) 



takewhile(predicat, iterable) -> iterateur 

Renvoie les elements de iterable tant que predicate(element) renvoie True. 
Un garde 



>» import itertools 

>» def guard(element) : 

... return element != 'stop' 

>» elements = [1, 2, 'a', 'stop', 12] 

>» it = itertools. takewhile(guard, elements) 

>» list (it) 

[1, 2, 'a'] 



tee(iterable(, n=2)) -> tuple d'iterateurs 

Decoupe iterable en n iterables, renvoyes sous la forme d'un tuple. Chaque iterable 
renvoie ensuite les elements de iterable. 

Duplication 



>» [list(el) for el in itertools. tee(['a' , 'b', 'c'], 3)] 
[['a', 'b', 'c'], ['a', 'b', 'c'], ['a', 'b', 'c']] 



Le module re 



Le module refournit des fonctionnalites d'expressions regulieres, similaires a ce qui 
existe en Perl. 



Expressions regulieres ? 

Les expressions regulieres, ou expressions rationnelles, permettent de rechercher 
dans un texte des elements correspondants a un motif. L'expression reguliere {regexp) 
utilise une grammaire pour decrire ce motif, qui est ensuite interpretee dans un auto- 
mate de parcours de texte. 
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Un des tout premiers programmes informatiques qui aient beneficie de ce systeme, 
issu des travaux du mathematicien Kleene, cstgrep sous GNU/Linux : les recherches 
dans les fichiers peuvent etre realisees avec des regexp. 

Recherche dans les sources de Python 2.4 

$ cd python2.4 

$ grep -ri "bicycle. *man.*emacs" . 

./site-packages/bi keemacs.py:# Bicycle Repair Man integration with 

(X)Emacs 

Toute la puissance de ce systeme reside dans la grammaire utilisee dans les expres- 
sions, qui est de type 3 dans la classification de Chomsky, c'est-a-dire apte a decrire un 
langage complet. 

En d'autres termes, il n'y a aucune limite dans la recherche de texte basee sur ce sys- 
teme, meme si les expressions deviennent vite complexes a mettre au point. II existe 
dans ce cas un programme de debogage d'expressions regulieres pour Python, appele 
Kodos (http://kodos.sourceforge.net/), qui permet de travailler en mode essai-erreur 
sans avoir a concevoir un programme. 



Figure 10-1 

Kodos en action 



Q@S 



File Edit Help 



& y x m OS 



% IH 



Regular Expression 



(?P<key>.*?)=(?P<value>.*?)\s||$ 






Flags 

I - IgnoreCase |~" Multi Line |~ Dot All |~" Verbose |~ Locale |~ Unicode 






String 



color=green color=white color=yellow color=purple 






Match number: 3 t] 



Group Match Sample Code 



color=green color=white color=vellow color=purple 






V Pattern matches (found 4 matches) 



_J 
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En SAVOIR PLUS Les expressions regulieres 

Pour plus d'informations sur les expressions regulieres, lire Les expressions regulieres par I'exemple de 
Vincent Fourmond, aux editions H&K 



Notation pour les expressions regulieres 

Meme si les expressions regulieres ne sont pas propres a un langage, chaque imple- 
mentation introduit generalement des specificites pour leur notation. 

L'antislash (\) tient un role particulier dans la syntaxe des expressions regulieres 
puisqu'il permet d'introduire des caracteres speciaux. Comme il est egalement inter- 
prete dans les chaines de caracteres, il est necessaire de le doubler pour ne pas le 
perdre dans l'expression. 

Expressions regulieres 

>» expression = "\btest\b" 

>» print(expression) 

test 

>» expression = "\\btest\\b" 

>» print(expression) 

\btest\b 

Cette ecriture nest cependant pas tres lisible, et l'utilisation de chaines brutes (raw 
strings) qui ne sont pas interpretees par le compilateur evite le doublement des antislashs. 

Expression reguliere en raw string 

>» expression = r"\btest\b" 
>» print(expression) 

\btest\b 



Syntaxe des expressions regulieres 

La syntaxe des expressions regulieres peut se regrouper en trois groupes de symboles : 

• les symboles simples ; 

• les symboles de repetition ; 

• les symboles de regroupement. 

Symboles simples 

Les symboles simples sont des caracteres speciaux qui permettent de definir des 
regies de capture pour un caractere du texte et sont reunis dans le tableau ci-dessous. 
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Tableau 10-1 


Symboles expressions regulieres 


Symbole Fonction Exemple 




Remplace tout caractere sauf le saut 
de ligne. 


>» re.findall (r' .' , ' test *') 

[' ', 'f, 'e', 's', 't\ ' ', '*'] 

>» re.findall (r' .' , 'test\n') 

['f, 'e', 's', 't'] 

>» re.findall (r' .' , '\n') 

[] 


A 


Symbolise le debut d'une ligne. 


>» re.findall (r' Ale' , "c'est le debut") 

[] 

>» re.findall (r' Ale' , "le debut") 

['le'] 


$ 


Symbolise la fin d'une ligne. 


>» re.findall (r'mot$' , 'mot mot mot') 
['mot'] 


\A 


Symbolise le debut de la chame. 


>» re.findall (r '\Aparoles' , 'paroles, 
paroles, paroles ,\nparoles, encore des 
parooooles') 
['paroles '] 


\b 


Symbolise le caractere d'espace- >» re.findall (r'\bpar\b' , 'parfaitement') 

ment. Intercepte seulement au debut [] 

ou a la fin d'un mot. Un mot est id >» re.findall (r'\bpar\b' , 'par monts et par 

une sequence de caracteres alphanu- veaux ' ) 

meriques ou espace souligne. ['par', 'par'] 


\B 


Comme \b mais uniquement lorsque 
ce caractere n'est pas au debut ou a 
la fin d'un mot. 


>» re.findall (r'\Bpar\B' , "imparfait") 

['par'] 

>» re.findall (r'\Bpar\B' , "parfait") 

[] 


\d 


Intercepte tout chiffre. 


>» re.findall (r'\d' , ' 1, 2, 3, nous irons au 

bois (a 12:15h)') 

['1', '2' , '3', '1' , '2', '1', '5'] 


\D 


Intercepte tout caractere sauf les 
chiffres. 


>» print ' ' . join(re.findall (r'\D' , '1, 2, 3, 
nous irons au bois (a 12:15h)')) 
, , , nous irons au bois (a :h) 


\s 


Intercepte tout caractere 
d'espacement : 

- tabulation horizontale(\t) ; 

- tabulation verticale(\v) ; 

- saut de ligne (\n) ; 

- retour a la ligne (\r) ; 

- form feed (\f). 


>» len(re.findall (r'\s' , "combien d'espaces 

dans la phrase ?")) 

5 

>» len(re.findall (r'\s' , 

"latoucheespaceestbloquee")) 



>» phrase = """Lancez 

. . . vous! """ 

>» len(re.findall (r'\s' , phrase)) 

1 
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Tableau 10-1 Symboles expressions regulieres (suite) 



Symbole Fonction Exemple 


\s 


Symbole inverse de \s 


>» len(re.findall (r'\S' , "combien de lettres 

dans la phrase ?")) 

29 


\w 


Intercepte tout caractere alphanume- >» ' ' . join(re.findall Cr'\w' , '*!mot-cle_*')) 
rique et espace souligne. ' motel e_' 


\W 


Symbole inverse de \w. 


>» " .join(re.findall(r'\w' , '*!mot-cle_*')) 


\z 


Symbolise la fin de la chame. 


>» re.findall (r'end\Z' , 'The end will come') 

[] 

>» re.findall (r'end\Z' , 'This is the end') 

['end'] 



Le fonctionnement de chacun de ces symboles est affecte par les options suivantes : 

• S ou DOTALL : le saut de ligne est egalement intercepte par le symbole \b. 

• (M)ULTILINE : dans ce mode, les symboles a et $ interceptent le debut et la fin de 
chaque ligne. 

• (L)OCALE : rend les symboles \w, \W, \b et \B dependants de la configuration de 
langue locale. Pour le francais, les caracteres comme « e » sont alors considered 
comme des caracteres alphanumeriques. 

• (U)NICODE : les symboles \w, \W, \b, \B, \d, \D, \s et \S se basent sur de l'unicode. 

• (I)GNORECASE : rend les symboles insensibles a la casse du texte. 

• X ou VERBOSE : autorise l'insertion d'espaces et de commentaires en fin de ligne, 
pour une mise en page de l'expression reguliere plus lisible. 

Symboles de repetition 

Les symboles simples peuvent etre combines et repetes par le biais de symboles de 
repetition : 





Tableau 10-2 Symboles de repetition 




Symbole Fonction Exemple 


* 


Repete le symbole precedent de a n 
fois (autant que possible). 


>» re.findall (r' pois*' , 

poi 1 ant poi ') 

['poiss' , 'pois' , 'poi ' , 


'poisson pois 
'poi'] 


+ 


Repete le symbole precedent del an >» re.findall (r'pois+' , 
fois (autant que possible). poi 1 ant poi ' ) 

['poiss' , 'pois'] 


'poisson pois 



La bibliotheque standard 

Troisieme partie 





Tableau 10- 


1 Symboles de repetition (suite) 


Symbole Fonction Exemple 


? 


Repete le symbole precedent ou 1 >» re.findall (r'pois?' , 'poisson pois 
fois (autant que possible). poilant poi') 

[ ' poi s ' , ' poi s ' , ' poi ' , ' poi ' ] 


{n} 


Repete le symbole precedent n fois. >» re.findall (r' poi s{2} ' , 'poisson pois 

poilant poi ') 
['poiss'] 


{n,m} 


Repete le symbole precedent entre n 
et m fois inclus. n ou m peuvent etre 
omis comme pour les tranches de 
sequences. Dans ce cas ils sont rem- 
places respectivement par et *. 


>» re.findall (r' poi s{2 ,4} ' , 
'poissssssssssssson pois poilant poi') 
['poissss '] 

>» re.findall (r' poi s{ ,4} ' , 
'poissssssssssssson pois poilant poi') 
['poissss', 'pois', 'poi', 'poi'] 
>» re.findall (r' poi s{2 ,}' , 
'poissssssssssssson pois poilant poi') 
['poisssssssssssss 1 ] 


{n,m}? 


Equivalent a {n , m} mais intercepte 
le nombre minimum de caracteres. 


>» re.findall (r' poi s{2, 4}?' , 

'poissssssssssssson pois poilant poi') 

[ ' poi ss ' ] 

>» re.findall (r' poi s{2 ,}?' , 

'poissssssssssssson pois poilant poi') 

['poiss'] 

>» re.findall (r' poi s{ ,4}?' , 

'poissssssssssssson pois poilant poi') 

[ ' poi ' , ' poi ' , ' poi ' , ' poi ' ] 


el|e2 


Intercepte I'expression el ou e2. 
(OR) 


>» re.findall (r' Mr |Mme' , 'Mr et Mme') 

['Mr', 'Mme'] 

>» re.findall (r' Mr | Mme' , 'Mr Untel') 

['Mr'] 

>» re.findall (r' Mr | Mme' , 'Mme Unetelle') 

['Mme'] 

>» re.findall (r' Mr | Mme' , 'Mile Unetelle') 

[] 


[] 


Regroupe des symboles et caracteres 
en un jeu. 


>» re.findall (r ' [abc]def ' , 'adef bdef cdef) 
['adef, 'bdef, 'cdef'] 



Le regroupement de caracteres accepte aussi des caracteres d'abreviation, a savoir : 

• - : definit une plage de valeurs. [a-z] represente par exemple toutes les lettres de 
l'alphabet en minuscules. 

• a : place en debut de jeu, definit la plage inverse, [^a-z] represente par exemple 
tous les caracteres sauf les lettres de l'alphabet en minuscules. 

Les symboles de repetition ?, * et + sont dits gloutons ou greedy : comme ils repetent 
autant de fois que possible le symbole precedent, des effets indesirables peuvent sur- 
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venir. Dans l'exemple suivant, l'expression reguliere tente d'extraire les balises html 
du texte sans succes : le texte complet est intercepte car il correspond au plus grand 
texte possible pour le motif. La solution est d'ajouter un symbole ? apres le symbole 
greedy, pour qu'il n'intercepte que le texte minimum. 

Effet greedy 

>» import re 

>» re. fi ndall (r '<.*>' , '<divxspan>le titre</span></div>') 
[ ' <di vxspan>l e ti t re</spanx/d"i v> ' ] 

>» re. f i ndall (r '<.*?>' , '<d"ivxspan>le titre</span></div>') 
['<div>', '<span>', '</span>', '</div>'] 



Symboles de regroupement 

Les symboles de regroupement offrent des fonctionnalites qui permettent de com- 
biner plusieurs expressions regulieres, au-dela des jeux de caracteres [] et de la fonc- 
tion OR, et d'associer a chaque groupe un identifiant unique. Certaines d'entre elles 
permettent aussi de parametrer localement le fonctionnement des expressions. 

Tableau 10-3 Symboles de regroupement 



Symbole Fonction Exemple 


(e) 


Forme un groupe avec l'expression e. Si >» re.fi ndall (r' (\(03\)) (80) (. *) ' , 

les caracteres « ( » ou « ) » sont utilises ' (03) 80666666 ' ) 

dans e, ils doivent etre prefixes de « \ » [('(03)', '80', '666666')] 


(7FLAGS) 


Insere directement des flags d'options 
dans l'expression. S'applique a I'expres- 
sion complete quel que soit son position- 
nement. 


>» re.findall(r'(?i)AAZ*' , 'aaZzzRr') 
[ ' aaZzz ' ] 


(?:e) 


Similaire a (e) mais le groupe intercepte 
n'est pas conserve. 


>» 

re . f i ndall ( r ' (? : \ (03\) ) (? : 80) ( . *) ' , 

'(03)80666666') 

['666666'] 


(?P<name>e) 


Associe I'etiquette name au groupe. Ce 
groupe peut ensuite etre manipule par ce 
nom par le biais des API de re, ou meme 
dans la suite de l'expression reguliere. 


>» match = 

re.search(r' (03)(80) (?P<numero>.*) ' , 

'0380666666') 

>» match. group('numero') 

'666666' 


(?#comment) 


Insere un commentaire, qui sera ignore. Le >» re. fi ndall (r' (?# recuperation des 

mode verbose est plus souple pour I'ajout balises)<. ■•?>' , 

direct de commentaires en fin de ligne. ' <h2xspan>hopl a</spanx/h2> ' ) 

['<h2>', '<span>', '</span>', '</h2>'] 
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Tableau 10-3 Symboles de regroupement (suite) 



Symbole 


Fonction 


Exemple 


(?=e) 


Similaire a (e) mais le groupe n'est pas 


>» re.findall (r' John(?= Doe)', 




consomme. 


'John Doe') 
['John'] 
>» re.findall (r' John(?= Doe)', 

'John Minor') 
[] 


(?!e) 


Le groupe n'est pas consomme et est 


>» re.findall (r'John(?! Doe)', 




intercepte uniquement si le pattern (le 


'John Doe') 




motif) n'est pas e. (? ! e) est le symbole 
inverse de (?=e) 


[] 

>» re.findall (r' John(?! Doe)', 

'John Minor') 
['John'] 


(?<=el)e2 


Intercepte e2 a condition qu'elle soit pre- 


>» re.findall (r' (?<=John )Doe', 




fixes d'el . 


'John Doe') 
['Doe'] 
>» re.findall (r' (?<=John )Doe', 

'John Minor') 
[] 


(?<!el)e2 


Intercepte e2 a condition qu'elle ne soit 


>» re.findall (r' (?<! John )Doe', 




pas prefixee d'el. 


'John Doe') 
[] 
>» re.findall (r' (?<! John )Doe', 

'Juliette Doe') 
['Doe'] 


(? (id/name) 


Rend I'expression conditionnelle : si le 


>» 


el|e2) 


groupe d'identifiant id ou name existe, 


re.match(r' (?P<onex)?(\d+)(?(one)>) ' 




el est utilisee, sinon e2. e2 peut etre 


, '123>') 




omise, dans ce cas el ne s'applique que si 
le groupe id ou name existe. 


>» 

re.match(r' (?P<onex)?(\d+) (?(one)>) ' 




Dans I'exemple <123> et 123 sont inter- 
cepts mais pas 12 3>. 


, '123') 

<_sre.SRE_Match object at 0xb7dea7b8> 

>» 

re.match(r' (?P<onex)?(\d+)(?(one)>) ' 

, '<123>') 

<_sre.SRE_Match object at 0xb7dea770> 



Exemples plus complets 

Void une serie d'exemples plus complets, mettant en ceuvre les differentes mecani- 
ques. L'expression est optionnellement accompagnee de flags. 
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Tableau 10-4 Exemples 



Expression!, flags] 

\w+@\w+\.\w{2,4} 



Objectif 

Intercepte les e-mails 



(<body.*>)(.*)(</body>), 
ICNORECASE 



Intercepte le corps d'un 
fichier HTML. 



Explication 

L'e-mail est compose de trois parties separees par 
« @ » et « . ». La derniere partie fait entre deux et qua- 
tres caracteres. (com, fr, biz, etc.) 



Les elements sont regroupes en trois parties, et seul le 
deuxieme groupe sera utilise. 



(?<=\s"{3}) . *?(?=" {3}\s) Intercepte tous les com- Utilise des assertions sur le texte precedent et suivant 

mentaires triple-quoted (trois guillemets). Le ? suffixant le . * permet d'arreter 



d'un texte. 






des qu'un deuxieme triple-quote est atteint. 



J 



Fonctions et objets de re 

Le module re contient un certain nombre de fonctions qui permettent de manipuler 
des motifs et les executer sur des chaines : 

• compile (pattern[, flags]) : compile le motif pattern et renvoie un objet de 
type SRE_Pattern. 

• escape(string) : ajoute un antislash (\) devant tous les caracteres non alphanu- 
meriques contenus dans string. Permet d'utiliser la chaine dans les expressions 
regulieres. 

• findall (pattern, string [, flags]) : renvoie une liste des elements intercep- 
tes dans la chaine string par le motif pattern. Lorsque le motif est compose de 
groupes, chaque element est un tuple compose de chaque groupe. 

• finditer(pattern, string[, flags]) : equivalente a findall (), mais un itera- 
teur sur les elements est renvoye. flags est un entier contenant d'eventuels flags, 
appliques au motif complet. 

• match(pattern, string[, flags]) : renvoie un objet de type MatchObject si le 
debut de la chaine string correspond au motif flags est un entier contenant 
d'eventuels flags, appliques au motif complet. 

• search(pattern, string[, flags]) : equivalente a match() mais recherche le 
motif dans toute la chaine. 

• split(pattern, string[, maxsplit = 0]) : equivalente au split () de l'objet 
string. Renvoie une sequence de chaines delimitees par le motif pattern. Si 
maxsplit est fourni, limite le nombre d'elements a maxsplit, le dernier element 
regroupant la fin de la chaine lorsque maxspl i t est atteint. 

• sub(pattern, repl , string[, count]) : remplace les occurrences du motif 
pattern de string par repl. repl peut etre une chaine ou un objet callable qui 
recoit un objet MatchObject et renvoie une chaine. Si count est fourni, limite le 
nombre de remplacements. 
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• subn (pattern, repl , string[, count]) : equivalente a sub() mais renvoie un 
tuple (nouvelle chaine, nombre de remplacements) au lieu de la chaine. 

Classe SRE Pattern 

La classe SRE_Pattern, contient une expression reguliere compilee, et accelere les 
traitements lorsqu'elle est utilisee plusieurs fois. Cette classe fournit en methodes 
toutes les fonctions ci-dessus, et le parametre pattern nest plus a fournir. 

Pour les methodes de recherche, rappelees ci-dessous, deux parametres optionnels sup- 
plementaires, pos et endpos, servent a delimiter une sous-chaine de recherche. II n'est 
egalement plus necessaire de definir les flags, puisqu'ils sont donnes a compi 1 e() : 

• match(string[, pos[, endpos]]); 

• search(string[, pos[, endpos]]) ; 

• findall (string [, pos[, endpos]]) ; 

• finditer(string[, pos[, endpos]]). 

Compilation de motif 

>» import re 

>» motif = re. compi 1 e(r ' \d{2} ') 

>» motif .findall ('voici 32 bananes et 12 5 carottes, de quoi f ai re 3 

gloubiboulga') 

['32', '12'] 

>» motif .findall (' rajoute quand meme 18 navets') 

['18'] 

Classe MatchObject 

La classe MatchObject, quant a elle, est retournee par les fonctions ou methodes 
match() et search (), et est utilisee dans sub () etsubn(). 

Elle offre un certain nombre de methodes : 

• group([groupl, . . .]) : renvoie un ou plusieurs groupes du resultat de l'expres- 
sion reguliere. groupO peut recevoir en parametre des indices de groupes, ou leurs 
noms lorsqu'ils ont ete definis. Sans aucun parametre, renvoie toute la chaine. 

• groups([default]) : renvoie un tuple contenant tous les groupes. Si defaut est 
fourni, c'est le nom ou l'indice d'un groupe qui n'a pas participe au motif. 

• groupdict( [default]) : equivalente a groups (), mais renvoie uniquement les grou- 
pes nommes, sous la forme d'un dictionnaire dont les cles sont les noms des groupes. 

• start([group]) : renvoie l'indice du premier caractere intercepte dans la chaine. 
Si group est fourni, c'est un entier ou un nom qui identifie le groupe dans lequel 
chercher. start () recherche dans toute la sequence. 
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• end ([group]) : renvoie l'indice du dernier caractere intercepte dans la chaine. Si 
group est fourni, c'est un entier ou un nom qui identifie le groupe dans lequel 
chercher. end() recherche dans toute la sequence par defaut. 

• pos : renvoie le parametre pos fourni a search () ou match (). par defaut. 

• endpos : renvoie le parametre endpos fourni a search () ou match (). Indice du 
dernier caractere par defaut. 

• expand (tempi ate) : equivalents a sub, ou template est la chaine de substitution. 

• 1 astg roup : renvoie le nom du dernier groupe intercepte, ou None si inexistant ou 
non nomme. 

• 1 asti ndex : renvoie l'indice du dernier groupe intercepte, ou None si inexistant. 

• re : renvoie l'objet SRE_Pattern qui a ete utilise. 

• stri ng : renvoie la chaine qui a ete recherchee. 

• span([group]) : renvoie le tuple correspondant a (self .start(group) , 
self .end(group)). 

Les backreferences 

Pour toutes les fonctions ou methodes de substitution, il est possible d'inserer dans la 
chaine de substitution les valeurs interceptees par des groupes. Chaque sequence corres- 
pondant a un groupe peut etre inseree par le biais de marqueurs appeles backreferences. 

Les backreferences ont trois ecritures possibles : 

• \i : ou i est l'indice du groupe, l'indice du premier groupe etant 1. 

• \g<i> : ou i est l'indice du groupe. 

• \g<name> : ou name est le nom du groupe. 

Backreferences 

>» import re 

>» motif = re.comp-ileC (Mr |Mme |Mlle)\s([A-Za-z]+)\s([A-Za-z]+) ') 

>» print(motif . sub(r'Nom: \3 , Prenom: \2 ' , 'Mr John Doe')) 

Nom: Doe, Prenom: John 

>» print(motif . sub(r'Mon nom est \g<3>, \g<2> \g<3>', 'Mr lean Bon')) 

Mon nom est Bon, lean Bon 

>» motif = re.compileC (Mr |Mme |Mlle)\s(?P<prenom>[A-Za- 

z] +)\s (?P<nom> [A-Za-z] +) ' ) 

>» print(motif . sub(r'\g<prenom>, de la lignee des \g<nom>', 

'Mr Pif LeChien')) 
Pif, de la lignee des LeChien 
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Le module Tkinter 

Le module Tki nter fournit des outils de construction d'interfaces de type Tcl/Tk, inde- 
pendantes de la plate-forme. Pour la programmation d'interfaces graphiques en Python, 
le toolkit Tcl/Tk est aujourd'hui avantageusement remplace par d'autres systemes 
d'interface comme wxPython, qui permet d'utiliser wxWindows, ou encore PyQt/ 
PyKDE, qui seront detailles dans l'annexe sur les bibliotheques tierces. Ces outils tiers 
sont aujourd'hui plus largement repandus que Tcl/Tk et offrent une meilleure integra- 
tion au systeme hote ainsi qu'un panel de composants beaucoup plus riche. 

II reste bien sur possible de composer une interface graphique complete avec Tel, 
mais au prix d'un effort superieur et d'un rendu final au look un peu « vieillot ». 
Cependant pour des besoins tres limites en interfaces, Tkinter offre l'enorme avan- 
tage d'etre entierement integre a Python et les systeme hotes ont generalement une 
installation standard de Tk Tkinter reste dans ce cas un excellent choix. Cette sec- 
tion presente une simple introduction a Tkinter, avec le minimum d'informations 
necessaires a la conception d'interfaces basiques. 



En savoir plus Python et Tkinter 

Le lecteur interesse pourra approfondir en lisant Python and Tkinter Programming de John Grayson, aux 
editions Hanning. 



Programmation evenementielle 

Un programme dote d'une interface graphique base son fonctionnement sur les eve- 
nements qui lui sont envoyes par le systeme via cette interface. Les evenements 
regroupent, entre autres, toutes les actions souris ou clavier de l'utilisateur sur l'inter- 
face. En d'autres termes, lorsque le programme est lance, il n'execute pas une 
sequence de code comme un script classique, mais se met en attente d'evenements 
dans une boucle sans fin. 

Chaque evenement recu par le programme est alors envoye puis traite par un ges- 
tionnaire special, qui execute tout code eventuellement associe a 1' evenement. Con- 
cevoir une interface graphique consiste done a associer a des evenements l'execution 
de portions de code. 

La classe Tk 

La classe Tk est un widget special qui, lorsqu'elle est instanciee, genere un nouvel 
interpreteur Tel et represente la fenetre principale de l'application, sur laquelle on 
peut greffer d'autres widgets. 
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Instanciee dans l'interpreteur, elle s'affiche directement a l'ecran. 
Application Tk minimale 

>» from Tkinter import * 

>» Tk() 

<Tk"inter.Tk instance at 0xb7a9ffcc> 



Les widgets de base de Tkinter 

Tkinterfournit un certain nombre de classes appelees widgets, qui permettent de 
composer une interface graphique. Toutes ces classes savent s'afficher et gerent un 
certain nombre d'evenements et un nombre relativement important de methodes (en 
general plus d'une centaine). 

Les 15 widgets de base de Tki nter sont : 

• Button : un bouton simple, qui permet de lancer une commande ; 

• Canvas : un widget generique, qui offre une surface de dessin ; 

• Checkbutton : une case a cocher ; 

• Entry : un champ texte ; 

• Frame : un widget qui peut contenir d'autres widgets (une fiche) ; 

• Label : affiche un texte ou une image ; 

• Listbox : une liste de choix deroulante ; 

• Menu : un menu ; 

• Menubutton : un element de menu, qui permet de lancer une commande ; 

• Message : un label evolue ; 

• Radiobutton : un selecteur ; 

• Scale : une reglette qui permet de modifier une valeur ; 

• Scrollbar : un ascenseur, generalement associe a la bordure d'un autre widget pour 
se deplacer ; 

• Text : peut contenir du texte editable, et des elements supplementaires comme du 
texte ; 

• Toplevel : equivalent au widget Frame, mais permet de gerer une fenetre modale 
autonome. 



Culture Fenetre modale 

Une fenetre modale est une fenetre qui s'affiche et attend une interaction de I'utilisateur par le biais du 
clavier ou de la souris. Pendant cette attente, toute autre action avec ces derniers est impossible hors de 
la fenetre modale dans la meme application. 
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Chacun de ces widgets presente des options et methodes communes, qui permettent 
de specifier les proprietes de positionnement, de forme ou de fonctionnement, ainsi 
que des elements specifiques. 

Positionnement d'un widget 

Le positionnement d'un widget dans un widget conteneur se fait par le biais de la 
methode pack(), qui rend en outre le widget visible. 

Ce systeme est disponible par defaut et remplit la plupart des besoins de mise en 
page, meme s'il reste possible d'utiliser des systemes geometriques plus complets, 
bases sur des grilles. Void les cas d'utilisation les plus communs. 

Remplir entierement le conteneur 

Utilise avec f i 11 a BOTH et expand a 1, pack() utilise tout l'espace directement dispo- 
nible du conteneur, en prenant en compte les proprietes d'extensibilite du widget. Si 
la taille de la fiche est modifiee, le widget suit les modifications. 

Une fiche avec une liste 

>» from Tkinter import * 

>» racine = Tk() 

>» liste = Listbox(racine) 

>» liste. insert(END, 'coucou') 

>» liste.pack(fill=BOTH, expand=l) 

Placer les widgets en pile 

f i 11 a X permet de signaler que le widget prend toute la largeur disponible. Ajouter 
sequentiellement des widgets dans un conteneur les place en pile, les uns au-dessus 
des autres. 

Pile de boutons 

>» from Tkinter import * 

>» racine = Tk() 

>» for i in range(lO): 

... bouton = Button(racine) 
bouton ['text'] = str(i) 

... bouton. pack (fill =X) 



Placer les widgets sur une meme ligne 

Le parametre side permet de caler un widget a gauche (LEFT) ou a droite (RIGHT). 
Pour placer plusieurs widgets sur la meme ligne, il suffit de tous les caler du meme cote. 
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Widgets sur la meme ligne 

>» from Tkinter import * 

>» racine = Tk() 

>» ok = Button(racine) 

>» ok ['text'] = 'OK' 

>» cancel = Button (racine) 

>» cancel ['text '] = 'Cancel' 

>» ok.pack(side=LEFT) 

>» cancel .pack(side=LEFT) 



Options et methodes d'un widget 

Chaque widget possede un certain nombre de proprietes, appelees options, qui sont 
utilisees par le systeme pour sa manipulation et son affichage. 

Les options peuvent etre lues et configurees comme des elements de dictionnaire, ou 
specifiees en parametres du constructeur. 

Manipulation des options d'un widget 



>» import Tkinter 

>» mon_texte = Tkinter. Text () 

>» mon_texte['font '] 

' -*-*-medi um-r-normal --14-*-*-* 

>» mon_texte[' state'] 

'normal ' 

>» mon_texte[' height'] 

'24' 

>» mon_texte[' height'] = '50' 



-c-*-iso8859-15' 



Les docstrings des constructeurs de chaque classe permettent de s'informer sur ses 
options disponibles. 

Options de Text 

>» import Tkinter 

>» Tkinter. Text . doc 

'Text widget which can display text in various forms.' 

>» print (Tki nte r . Text . i ni t . doc ) 

Construct a text widget with the parent MASTER. 

STANDARD OPTIONS 

background, borderwidth, cursor, 
exportselection, font, foreground, 
highlightbackg round, highlightcolor , 
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hi ghl i ghtthi ckness , i nsertbackg round , 
insertborderwidth , insertofftime, 
insertontime, insertwidth, padx, pady, 
relief, selectbackg round, 
selectborderwidth , selectforeground, 
setgrid, takefocus, 
xscroll command, yscroll command, 

WIDGET-SPECIFIC OPTIONS 

autoseparators , height, maxundo, 
spacingl, spacing2, spacing3, 
state, tabs, undo, width, wrap, 

Les fonctionnalites specifiques des widgets sont ensuite disponibles par le biais d'une 
poignee de methodes. La section suivante presente pour chaque widget de base un 
exemple d'utilisation. 

Button 

Le widget button est tres simple a utiliser, puisqu'il suffit de fournir dans l'option 
command un objet callable, qui sera appele lorsque l'utilisateur appuiera sur le bouton. 

Dans l'exemple suivant, lorsque l'utilisateur clique sur le bouton, le texte du bouton 
est modifie par la fonction click(). 

Exemple de bouton 

>» from Tkinter import * 

>» racine = Tk() 

>» bouton = Button(racine, text=' Click') 

>» def clickO : 

... bouton [ 'text'] = 'bien recu' 

>» bouton [' command ' ] = click 
>» bouton .pack() 

II existe deux methodes specifiques a la class Button : 

• f 1 ash () : fait clignoter le bouton en le redessinant plusieurs fois. 

• i nvoqueO : appelle la commande associee au bouton. 

Canvas 

Le widget canvas est un widget generique qui offre des possibilites generiques de 
trace et permet de creer des widgets personnalises. Le canvas presente une surface de 
dessin avec son propre systeme de coordonnees. 
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Les elements places sur le canvas sont appeles canvas items et sont nommes : 
arc : une corde ; 
i mage : une image ; 
line : une ligne ; 
oval : un cercle ou une ellipse ; 
polygon : un polygone ; 
rectangl e : un rectangle ou un carre ; 
text : un texte ; 
window : un widget quelconque. 

Chacun de ces elements peut etre cree par le biais de la methode create_xx(), ou xx 
est le nom de 1' element. 

Creation d'un canvas avec une ligne 

>» from Tkinter import * 

>» racine = Tk() 

>» canvas = Canvas (racine) 

>» ligne = canvas. create_line(0, 0, 100, 100) 

>» canvas. pack() 

Checkbutton 

Le widget Checkbutton fonctionne avec une variable definie dans l'option variable, 
dont il synchronise l'etat avec celui affiche a l'ecran. 

Les classes de variables en Tkinter sont : 

• IntVar, pour les entiers et les entiers longs ; 

• Bool eanVar, pour les booleens ; 

• Doubl eVar, pour les reels ; 

• Stri ngVar pour les chaines de caracteres. 

Pour CheckButton, la variable est une classe de type IntVar, et prendra les valeurs 
ou 1, ou de type Bool eanVar, pour les valeurs True ou Fal se. 

Exemple de Checkbutton 

>» from Tkinter import * 

>» racine = Tk() 

>» variable = IntVarO 

>» check = Checkbutton(racine, variable=variable) 

>» check['text'] = 'check' 

>» check. pack() 
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II est egalement possible d'associer des valeurs differentes de et 1 par les options 
onval ue et of f val ue. La classe de variable doit avoir un type compatible avec ces valeurs. 

Exemple de Checkbutton avec StringVar 

>» from Tkinter import * 

>» racine = Tk() 

>» variable = StringVarO 

>» check = Checkbutton (racine, variable=variable, 

onval ue= ' oui ' , of fval ue= ' non ' , 
... text='voulez-vous recevoi r nos promotions ?') 

>» check. pack() 

Dans cet exemple, la variable a egalement ete placee en attribut de l'objet check. 

Entry 

Le widget Entry affiche une ligne unique de saisie de texte. La methode get() recu- 
pere le texte saisi. II est egalement possible d'associer cette valeur, par le biais de 
l'option textvariable, a une variable de type StringVar. 

Dans l'exemple ci-dessous, le texte saisi est affiche sur la sortie standard, lorsque 
l'utilisateur appuie sur le bouton. 

Exemple de saisie de texte 

>» from Tkinter import * 

>» racine = Tk() 

>» valeur = StringVarO 

>» entree = Entry(racine, textvariable=valeur, 

... text='Saisissez votre nom') 

>» def saisie() : 

... print(valeur.getO) 

>» bouton = Button(racine, command=saisie, text='OK') 
>» entree. pack() 
>» bouton .pack() 

Entry fournit egalement des methodes de manipulation du texte, comme : 

• delete(first, last=None) : supprime le texte, partant de la position first a 
last. Si last est omis, un seul caractere est supprime. 

• icursor(index) : positionne le curseur a la position i ndex. 

• insert (index, string) : insere string a la position index. 

• selection_range(start, end) : selectionne le texte de la position start a end. 

• selection_clear() : annule toute selection, etc. 
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Utilisation d'insert 



from Tkinter import * 

racine = Tk() 

entree = Entry(racine, text='Saisissez votre nom') 

def saisieO : 

entree. insert(0, 'Bonjour, ') 

bouton = Button(racine, command=saisie, text='OK') 
entree. pack() 
bouton .pack() 

Frame 

Le widget Frame represente une region rectangulaire utilisee pour contenir d'autres 
widgets et pour organiser la mise en page. 

Un objet Frame peut etre construit avec le parametre master qui definit le widget 
parent. S'il est omis, c'est le widget racine qui est utilise. 

Des options supplementaires peuvent etre fournies en keywords, comme : 

• background ou bg : couleur du fond ; 

• borderwidth ou bd : largeur de la bordure ; 

• height : hauteur en pixels ; 

• width : largeur en pixels. 

Deux frames cote a cote 

>» from Tkinter import * 

>» racine = Tk() 

>» frame_l = Frame (width=100, height=100, bg="blue") 

>» f rame_l.pack(side=LEFT) 

>» frame_2 = Frame(width=100, height=100, bg="red") 

>» f rame_2 .pack(side=LEFT) 

Label 

Le widget Label affiche un texte ou une image, et gere en interne un double buffer. 
Ce mecanisme permet de modifier le contenu de 1' objet a l'ecran sans aucun clignote- 
ment puisque c'est une version en memoire qui est mise a jour avant affichage. 

Affichage d'un texte 

>» from Tkinter import * 

>» racine = Tk() 

>» mon_texte = Label (racine, text="C'est le texte") 

>» mon_texte.pack() 
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Lorsque l'objet est utilise pour afficher une image, un objet de type Photolmage 
(images au format gif) ou Bitmaplmage (images au format xll Bitmap) doit etre 
fourni dans l'option image. 

Affichage d'une image 

>» from Tkinter import * 

>» racine = Tk() 

>» "image = Photolmage (file='/home/tziade/fade. gif) 

>» texte = Label (racine, image=image) 

>» texte. pack() 

Listbox 

Ce widget affiche une liste d'elements. Chaque element de la liste est un texte, et peut 
etre ajoute parlebiais de la methode insert (), et retire par la methode delete(). 

insert() prend deux parametres : la position d'insertion qui est un indice entier ou 
les valeurs speciales END (derniere position) ou ACTIVE (indice de 1' element selec- 
tionne), et le texte. 

delete() prend l'indice de l'element a supprimer, et de facon optionnelle un 
deuxieme indice, pour supprimer une serie d'elements. 

Liste de trois elements 

>» from Tkinter import * 

>» racine = Tk() 

>» choix = Listbox(racine) 

>» for element in ('un', 'deux', 'trois'): 

... choix. insert(END, element) 

>» choix. pack() 

Menu 

Menu sert a concevoir un menu, contextuel ou general. Le widget fournit une 
methode add_command(), qui permet d'ajouter une entree de menu, et une methode 
add_cascade(), pour greffer un sous-menu, qui est lui-meme un widget Menu. 

Un menu general est associe et affiche a la fenetre par le biais de la methode 
configO de la fenetre. 

Menu general « Fichier » 

>» racine = Tk() 

>» menu = Menu(racine) 

>» def actionlO : 

... print ('acti on 1') 
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>» menu_fichier = Menu(menu) 

>» menu_fichier .add_command (label ="Acti on 1", command=actionl) 

>» menu.add_cascade(label="Fichier" , menu=menu_fichier) 

>» racine. config(menu=menu) 

Pour les menus contextuels, la methode postO du menu est utilisee pour un affi- 
chage direct, et associee a l'evenement clic droit. 

Menu contexuel 

>» racine = Tk() 

>» menu = Menu(racine) 

>» def actionl(): 

print ('acti on 1') 

>» menu.add_command(label="action 1", command=actionl) 

>» def popup(event) : 

... menu. post(event .x_root, event. y_root) 

>» racine. bind("<Button-3>" , popup) 
'1210676212popup' 

Les evenements sont couverts dans la prochaine section. 

Message 

Equivalente a Label mais affiche un texte multiligne, avec un passage a la ligne auto- 
matique. L'option width sert a definir la largeur du widget, la hauteur s'adaptant 
automatiquement. 

Texte multiligne 

>» from Tkinter import * 

>» racine = Tk() 

>» message = Message(text="Voici un texte qui devrait s 'adapter a la 

fenetre") 

>» message. pack() 

Radiobutton 

Le widget RadioButton affiche un selecteur, associe a une variable et une valeur. 
Lorsque l'utilisateur selectionne le selecteur, la variable se voit attribuer la valeur. 

Plusieurs widgets Radiobutton peuvent etre associes a une meme variable : un seul 
selecteur peut etre selectionne a la fois. 
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Selecteur 

>» from Tkinter import * 

>» racine = Tk() 

>» variable = IntVar() 

>» elements = CC'un', 1), ('deux', 2), ('trois', 3)) 

>» for texte, valeur in elements: 

... bouton = Radiobutton(text=texte, variable=variable, value=valeur) 

... bouton. pack(anchor=W) 



Scale 

Le widget Seal e est une glissiere qui sert a definir une valeur entiere dans un inter- 
valle donne. L'intervalle est fourni par les options from_ et to. La methode get() 
permet ensuite de recuperer la valeur. 

Glissiere 

>» from Tkinter import * 

>» racine = Tk() 

>» glissiere = Scale(f rom_=0, to=100) 

>» glissiere.pack() 

Scrollbar 

Le widget Scrol 1 bar fournit des ascenseurs a des widgets dont la taille est susceptible 
de depasser la taille affichee. C'est le cas par exemple des widgets Canvas ou Li stbox. 

La methode set() du widget definit la position de la glissiere de l'ascenseur, et un cal- 
lable peut etre associe a la modification de la position a l'option command, par le biais de 
la fonction conf i g () . 

Pour concevoir par exemple une liste avec un ascenseur vertical, ces deux methodes 
peuvent etre respectivement liees aux proprietes yscroll command et yview du widget 
Listbox. 

Liste avec ascenseur vertical 

»> from Tkinter import * 

>» racine = Tk() 

>» ascenseur = Scrollbar(racine) 

>» ascenseur .pack(side=RIGHT, fill=Y) 

>» liste = Listbox(racine, yscrollcommand=ascenseur.set) 

>» for i in range(lOO): 

liste. insert(END, str(i)) 

>» liste. pack(side=LEFT, fill=BOTH) 

>» ascenseu r . conf i g (command=l i ste . yvi ew) 
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Text 

Le widget Text affiche du texte formate, qui peut contenir des images et gerer des 
marqueurs. 

Toplevel 

Le widget TopLevel est un widget de type Frame, utilise pour afficher des fenetres 
modales. Typiquement, une application se sert de ce widget pour les dialogues de 
l'apprication. 

Affichage d'une fenetre modale 

>» from Tkinter import * 

>» racine = Tk() 

>» modale = Topi eve! () 

>» fermer = Button (modale, text="Fermer" , command=modale. destroy) 

>» fermer. pack() 



Binding d'evenements 

Lorsque 1' application est en attente d'evenements, chaque widget peut associer une 
fonction Python a un evenement quelle recoit, par le biais de la methode bind(). 

Les evenements majeurs qui peuvent etre interceptes, sont des evenements clavier ou 
des evenements souris. 

Evenements clavier : 

• <A1 t_L> : touches Alt (l_ pour Left, gauche et R pour Right, droite) ; 

• <BackSpace> : retour arriere (backspace) ; 

• <Cancel> : combinaison des touches Ctrl+C ; 

• <Caps_Lock> : verrouillage majuscules ; 

• <Control_L> : touches Ctrl (l_ pour Left, gauche et R pour Pvight, droite) ; 

• <Up> : fleche haut ; 

• <Left> : fleche gauche ; 

• <Down> : fleche bas ; 

• <Right> : fleche droite ; 

• <Delete> : touche Suppression ; 

• <End> : touche Fin ; 

• <Enter> : touche Entree ; 

• <Escape> : touche Echappement ; 

• <FN> : touches de fonctions F1, F2, F3... ; 
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• <Home> : touche Home ; 

• <Insert> : touche Insertion; 

• <Key> : touche quelconque ; 

• <Num_Lock> : touche verrouillage numerique ; 

• <Next> : touche Page down ; 

• <Pause> : touche Pause ; 

• <Prior> : touche Page up ; 

• <Print> : touche Impression ; 

• <Return> : touche Entree ; 

• <Shi f t_L> : touches Shift (l_ pour Left, gauche et R pour Right, droite) ; 

• <Scroll_Lock> : touche Verrouillage defilement ; 

• <Tab> : touche Tabulation. 

Intercepte les evenements clavier 

>» from Tkinter import * 

>» racine = Tk() 

>» def evenement (event) : 

... print 'evenement clavier' 

>» racine. bind('<Key>' , evenement) 
'1213559236evenement' 

Evenements souris : 

• <[Button|ButtonPress]-n> : un des boutons de la souris est appuye. n vaut 1 
(bouton gauche), 2 (bouton du centre) ou 3 (bouton de droite). Les prefixes 
Button ou Button Press peuvent etre utilises, ou n seul. 

• <Bn-Motion> : la souris est deplacee au dessus du widget, avec un bouton appuye 
(n vaut 1, 2 ou 3). 

• <ButtonRelease-n> : le bouton n est lache. 

• <Configure> : la taille du widget est modifiee. 

• <Double-Button-n> : equivalent a Button, mais pour un double-clic. 

• <Enter> : la souris entre sur le widget. 

• <Leave> : la souris sort du widget. 

• <Tri pi e-Button-n> : equivalent a Button, mais pour un triple-clic. 
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Intercepte le die gauche 

>» from Tkinter import * 
>» racine = Tk() 
>» def evenement(event) : 
print 'click! ' 

>» racine. bind('<Button-l>' , evenement) 
'1213558996evenement' 

Lorsque l'evenement est intercepte, un appel a la methode est effectue avec un objet 
Event, qui contient un certain nombre d'attributs : 

• char : le code du caractere sous forme de chaine (evenement clavier) ; 

• height : la nouvelle hauteur (evenement configuration) ; 

• keysym : le symbole de touche (evenement clavier) ; 

• keycode : le code de touche (evenement clavier) ; 

• num : le numero de bouton (evenement souris) ; 

• type : le type d'evenement ; 

• wi dget : un lien vers l'instance de widget liee a l'evenement ; 

• width : la nouvelle largeur (evenement configuration). 

• X : la position horizontale de la souris ; 

• x_root : la position horizontale de la souris, relative au coin superieur gauche ; 

• y : la position verticale de la souris ; 

• y_root : la position verticale de la souris, relative au coin superieur gauche. 

Interception clavier, exemple 2 

>» from Tkinter import * 

>» racine = Tk() 

>» def evenement(event) : 

... print('evenement clavier: %s ' % event. keycode) 

>» racine. bi nd('<Key>' , evenement) 
' 1213559796evenement ' 



Application type avec Tkinter 

Une application type en Tkinter, en dehors du prompt, doit appeler la methode 
mainloopO de la fenetre racine apres son instanciation, pour que l'interpreteur se 
place en attente des evenements. 

Une classe Appl i cati on peut servir a regrouper ces elements. 
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Classe Application 
from Tkinter import * 

class Application (object) : 

""" classe application """ 

def init (self) : 

self._tk = Tk() 

def mainloop(self) : 

self ._tk.mainloop() 

if name == ' main ': 

Application() .mainloopO 

En general, pour des mises en page elaborees, les widgets sont regroupes dans des 
classes derivees de Frame. Chacune des instances de Frame gere ses widgets comme 
attributs et se positionne sur la fenetre principale. 

Application peut aussi proposer une methode d'ajout de Frame pour associer l'ins- 
tance a un nom d'attribut. La maniere la plus elegante est de fournir la classe de 
Frame a la methode, et la laisser gerer l'instanciation. 

Exemple de creation de frames 



from Tkinter import * 

class Application(object) : 

""" classe application """ 

def init (self) : 

self._tk = Tk() 

def mainloop(self) : 

self ._tk. mainloopO 

def add_f rame(self , name, class_, 
instance = class_(self ._tk) 
setattr(self , name, instance) 
i nstance . pack("'"'-pack_opti ons) 



*pack_options) : 



class ButtonFrame(Frame) : 

""" barre de boutons """ 

def init (self, racine=None) : 

Frame. init (self, racine) 

self .boutton_quitter = Button(self, text="Quitter" 

command=sel f . qui t) 
sel f . boutton_qui tter . pack (si de=LEFT) 
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class TopFrame(Frame) : 

""" barre de boutons """ 

def "init (self, racine=None) : 

Frame. init (self, racine) 

self ['height'] = 200 
self['width'] = 200 
self['bg'] = 'red' 

if name == ' main ' : 

app = ApplicationO 

app.add_f rame('centrale' , TopFrame, fill=X) 

app. add_frame(' boutons' , ButtonFrame) 

app.mainloopO 

Cette organisation permet de conserver un mapping logique et des dependances 
coherentes, puisque chaque element peut etre atteint en fonction de sa position reelle 
dans un conteneur : 

• app. boutons. boutton_qui tter ; 

• app. central e, etc. 

Extensions pour Tkinter 

Des modules de la bibliotheque standard viennent completer Tki nter, a savoir : 

• Scrol 1 edText : widget texte dote d'ascenseurs ; 

• Ti x : widgets supplementaires pour Tk ; 

• tkColorChooser : implemente un dialogue de selection de couleur ; 

• tkCommonDialog : classe de base utilisee par tous les dialogues ; 

• tkFi 1 eDi al og : implemente des dialogues de selection de fichier ; 

• tkFont : utilitaires pour travailler avec les polices de caracteres ; 

• tkMessageBox : dialogues standards d'affichage de messages ; 

• tkSi mpl eDi al og : utilitaires et dialogues de base ; 

• Tkdnd : implemente le drag'n'drop ; 

• turtl e : fournit des primitives de trace turtle. 



Le module Hb2to3 et le script 2to3 

Le module lib2to3 fournit des fonctionnalites de traduction de code Python 2 en 
code Python 3. Installe par Python, le script 2to3 convertit des modules Python 2.x 
en modules Python 3. 
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Invocation de 2to3 

$ 2to3 --help 
Usage: ref actor. py 



[options] f"Me|dir 



Options: 

-h, --help show this help message and exit 

-d, --doctests_only Fix up doctests only 

-f FIX, --fix=FIX Each FIX specifies a transformation; default: 

all 

-x NOFIX, --nofix=NOFIX 

Prevent a fixer from being run. 

-1, --list-fixes List available transformations (fixes/ 

f i x_* . py) 

-p, --print-function Modify the grammar so that print() is a 
function 

-v, --verbose More verbose logging 

-w, --write Write back modified files 

-n, --nobackups Don't write backups for modified files. 

Le script peut etre lance une premiere fois a vide dans le repertoire qui contient le 
code source, puis applique avec -w. 

Test puis application de 2to3 



$ 2to3 * 

Refactori 

Refactori 

Refactori 

Refactori 

Refactori 

Refactori 

Refactori 

Refactori 

Refactori 

Refactori 



ngTool 
ngTool 
ngTool 
ngTool 
ngTool 
ngTool 
ngTool 
ngTool 
ngTool 
ngTool 



$ 2to3 

Refacto 

Refacto 

Refacto 

Refacto 

Refacto 

Refacto 

Refacto 

Refacto 

Refacto 

Refacto 



-w * 
ri ngTool 
ri ngTool 
ri ngTool 
ri ngTool 
ri ngTool 
ri ngTool 
ri ngTool 
ri ngTool 
ri ngTool 
ri ngTool 



Skipping implicit fixer: ws_comma 
Files that need to be modified: 

processing/ init .py 

processi ng/connecti on . py 
processi ng/f i nal i ze . py 
processi ng/forki ng . py 
processi ng/heap . py 
processi ng/managers . py 
processing/pool .py 
processi ng/process . py 



Skipping implicit fixer: ws_comma 
Files that need to be modified: 

processing/ init .py 

processi ng/connecti on . py 
processi ng/f i nal i ze . py 
processi ng/forki ng . py 
processi ng/heap . py 
processi ng/managers . py 
processing/pool .py 
processi ng/process . py 
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En un mot... 



Ce chapitre clot la presentation des modules principaux de la bibliotheque standard. 
L'annexe B presente une liste complementaire de bibliotheques tierces, qui repon- 
dent a des besoins plus specifiques. 

Le chapitre suivant presente des exercices corriges, bases sur les modules standards et 
complete egalement la presentation de la bibliotheque standard en presentant quel- 
ques modules secondaires. 
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Exercices corriges 



Please ! I can defeat them ! There's only a hundred-and-fifty of them ! 

— The Holy Grail 
« S'il vous plait ! Je peux les battre ! lis ne sont que cent cinquante ! » 

— Sacre Graal 



Ce chapitre met en pratique, a travers des exemples concrets, les modules les plus utilises 
de la bibliotheque standard de Python. Le souhait est de presenter la solution la plus 
concise possible en employant des techniques eprouvees de programmation Python. 



Mode d'emploi du chapitre 



Chaque exercice de ce chapitre est presente sous la forme de fiches avec : 

• une description du probleme ; 

• la liste des points techniques abordes dans 1' exercice, sous forme de mots-cles ; 

• la solution detainee ; 

• une discussion sur la solution presentee ; 

• les extensions ou paralleles possibles, ainsi que d'eventuelles references a d'autres 
exercices. 
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Les exercices sont presentes regroupes dans des thematiques qui sont : 

• programme : creation de programmes parametrables ; 

• texte : manipulation et transformation de texte ; 

• fichiers : manipulation du systeme de fichiers ; 

• threads et processus : programmation multithreads et multiprocessus ; 

• persistance : sauvegarde de donnees ; 

• Web et reseau : communication ; 

• divers : inclassables. 



Programme 



Cette section contient un seul exercice, qui presente une technique qui pourra etre 
reutilisee, pour formaliser la lecture des parametres fournis au programme lorsqu'il 
est execute en ligne de commande. 

Exercice 1 : programme parametrable 

Description 

L'objectif de ce premier exercice est de mettre au point un squelette de programme exe- 
cutable en ligne de commande. Le squelette doit fournir une gestion automatique de la 
lecture des eventuels parametres et faciliter l'ajout de parametres par le developpeur. 

Points abordes 

sys.argv, optparse, main 

Solution 

Squelette de programme 

#!/usr/bin/python 

# -*- coding: utf8 -*- 
from optparse import OptionParser 
import sys 

# parametres du programme 
options = {} 
options[(' -p' , '--print')] = {'dest': 'print', 

'help': 'lance l\'impression' , 
'action' : 'count' } 
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options [('-n' , '--printer')] = {'dest': 'printer', 

'help': ' nom de l\'imprimante' } 

def main(options , arguments): 

print('options %s' % options) 
print('arguments %s ' % arguments) 

if name == ' main ' : 

parser = OptionParserO 

for param, option in options. items() : 

parser . add_opti on (■• param , **opti on) 
options, arguments = parser. parse_args() 
main(options , arguments) 

Discussion 

Lorsqu'un programme Python est execute en ligne de commande, c'est-a-dire fourni 

en argument a l'interpreteur, l'objet module se voit attribuer la valeur mai n dans 

sa variable globale name . Ce mecanisme permet de differencier ce module des 

autres modules charges au gre des importations, i f name == ' mai n ' permet 

done de lancer le module comme programme principal. 

Le module optparse permet ensuite de lire automatiquement tous les parametres 
d'une maniere standardised, conformement au modele getopt() d'Unix. Un pro- 
gramme qui utilise ce formalisme laisse l'utilisateur fournir des parametres libres, 
appeles arguments, et des parametres nommes, appeles options. 

Les options sont declarees sous la forme -o valeur ou —option valeur. La pre- 
miere notation, prefrxee par un tiret, est appelee notation courte, et le nom de 
l'option ne doit etre defini que par un caractere. La deuxieme notation, la notation 
longue, prefrxee par deux tirets, est un mot complet. En general, chaque notation 
courte a son equivalent en notation longue. 

Chaque option peut etre configured avec des arguments : 

• action : definit Taction executee par optparse. La valeur par defaut est store et 
indique qu'il faut recuperer la ou des valeurs qui suivent l'option dans la variable 
definie dans dest. Lorsque action prend la valeur count, le module compte le 
nombre d'occurrences de l'option. 

• type : definit le type de la ou des valeurs fournies avec l'option. Par defaut a 
string. Valeurs possibles : 

— string ; 

— int ; 

— long ; 
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- float ; 

- complex ; 

- choice. 

• dest : definit le nom de la variable dans laquelle la ou les valeurs vont etres stoc- 
kees. 

• default : valeur(s) par defaut. 

• nargs : nombre d'arguments a fournir avec l'option. 

• choices : liste de choix possibles. 

• hel p : phrase d'aide. 

L'option -h, —help est generee automatiquement par defaut et affiche la liste des 
arguments avec pour chacun d'entre eux la phrase d'aide si elle a ete fournie. 

Page d'aide 

$ ./exl.py -h 

usage: exl.py [options] 

options : 

-h, --help show this help message and exit 

-p, --print lance l'impression 

-n PRINTER, --printer=PRINTER 

nom de l'imprimante 

Sous Mac OS X et Linux, il n'est pas necessaire d'appeler l'interpreteur Python 
explicitement si la premiere ligne du fichier fournit au systeme son chemin, et si le 
fichier Python est parametre comme etant executable. 

Sous Windows, un double-clic sur le fichier l'executera dans l'environnement IDLE 
dans une installation par defaut. Pour pouvoir l'executer dans l'invite de commande, 
il est necessaire de prefixer le nom du fichier par l'interpreteur. 

Execution sous Windows 



$ python.exe exl.py -h 
usage: exl.py [options] 



options : 
-h, --help 
-p, --print 
-n PRINTER, 



show this help message and exit 
lance 1 'impression 
-printer=PRINTER 

nom de l'imprimante 
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II existe un module equivalent a optparse, plus ancien, appele getopt, mais qui ne 
propose que des fonctions de lecture bas niveau, sans laisser la possibilite au deve- 
loppeur d'automatiser certains controles et certaines taches comme optparse le fait. 

Ce squelette de programme laisse le developpeur definir ses options dans un diction- 
naire qui est ensuite fourni au module de parsing. II appelle enfin la fonction 
main (options, arguments), qui est le point d'entree du programme. 

Linteret de separer les options dans un dictionnaire en tete de fichier est de les 
rendre plus lisibles. Elles sont detachees du reste de code et facilement modifiables. 

Extension 

Le module optparse n'est malheureusement pas internationalise et les messages 
d'erreur sont definis en dur dans le code du module. L'affichage de messages comme 
« at least one option string must be supplied » au moment de 1' execution du 
programme peut etre perturbant si le reste des messages est en francais. 

Une extension possible consisterait a mettre en place une internationalisation. La 
methode la plus rapide est d'intercepter les erreurs et traduire les messages a la volee. 
La solution la plus elegante et portable est de creer une version internationalisee du 
module. 



Tcxtc 

Cette partie propose trois exercices de manipulations basiques de chaines de carac- 
teres, de la saisie de texte a la recherche de motifs par expressions regulieres, en pas- 
sant par les methodes de tri. 

Exercice 2 : le chiffrement de Cesar 

Description 

Le chiffrement de Cesar est une manipulation basique qui consiste a decaler tous les 
caracteres alphabetiques d'un texte de 13 rangs (algorithme ROT13). Ainsi le mot 
« bonjour » devient « obawbhe », ou la phrase « Je programme en Python. » devient 
« Wr cebtenzzr ra Clguba. ». 

Lobjectif de l'exercice est de laisser l'utilisateur saisir un texte et d'afficher le resultat 
du chiffrement a l'ecran. 
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Points abordes 

Tableaux alphabetiques, list comprehension, string, maketrans, 

string. translate, input() et raw_input(), operateurs % et i n, manipulation de 
l'objet list. 

Solution 

Chiffrement de Cesar 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

from string import ascii_lowercase as letters 
from string import ascii_uppercase 
from string import maketrans 

# preparation du tableau de traduction 
def _rotl3(car) : 

new_pos = (letters. find(car) + 13) % len(letters) 
return letters [new_pos] 

CAESAR = ' ' . join([_rotl3(car) for car in letters]) 

# gestion des minuscules et majuscules 
CAESAR = CAESAR + CAESAR. upper() 
letters = letters + ascii_uppercase 

# generation d'un tableau de traduction 
TRANS = maketrans(letters, CAESAR) 

if name == ' main ': 

text = raw_input('Saisissez une phrase: ') 
print (text. translate (TRANS)) 

Discussion 

Le decalage est base sur l'utilisation de la fonction translate de l'objet de type str. 
Cette fonction prend en parametre un tableau de traduction de longueur 256 qui 
correspond aux nouvelles valeurs a utiliser pour chacun des caracteres de la table 
ASCII. Python utilise ici des fonctions rapides ecrites en C. 

La fonction maketrans permet de generer automatiquement ce tableau lorsque le 
developpeur travaille avec un sous-ensemble de la table ASCII. II prend en parame- 
tres deux sequences et renvoie le tableau correspondant. L'interet de ces fonctions est 
qu'elles sont tres rapides. 



Exercices corriges 

Chapitre 1 1 

L'utilisation d'une list comprehension rend plus compact le code necessaire a la 
construction de CAESAR : une liste est formee avec les caracteres decales, puis la 
sequence reformee avec join(). 

Lecriture explicite aurait ete : 
Sans list comprehension 

• preparation du tableau de traduction 
def _rotl3(car) : 

new_pos = (letters .find(car) + 13) % len(letters) 
return letters [new_pos] 

CAESAR = [] 

for car in letters: 

CAESAR . append (_rotl3 (car) ) 

CAESAR = " .join (CAESAR) 

Extension 

Les caracteres en dehors de la chaine ascii_lowercase ne sontpas traites etrenvoyes 
directement. Les caracteres accentues sont done kisses tels quels et une extension 
interessante serait d'etendre la chaine ascii_letters avec la plage des caracteres 
ISO-8859-15 ou UTF8, hen deplaise a Cesar. 

Exercice 3 : transformer les adresses e-mails et les URL d'un texte en 
liens 

Description 

Le but de ce troisieme exercice est de concevoir un algorithme concis de transforma- 
tion de texte, charge de remplacer toute occurrence d'e-mails et d'URL par son equi- 
valent HTML. 

Par exemple : 

• tarek@ziade.org 
devient 

<a href="mailto:tarek@ziade.org">tarek@ziade.org</a> 

• http://www.afpy.org 
devient 

<a href="http://www.afpy.org">http://www.afpy.org</a> 
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II faut concevoir un programme qui transforme un fichier texte en un deuxieme 
fichier texte, en appliquant cette modification. Le programme affiche aussi sur la 
sortie standard les modifications effectuees. 

Points abordes 

Expressions regulieres, traitement de fichiers, directive with. 



Solution 

Remplace e-mails et URL 

#! /usr/bi n/python 
# -*- coding: utf8 -*- 
import re 
import sys 

FIND_LINK = r'(?P<link>https|ftp|http+://+[A \t\n\r\f\v\<]*) ' 

FIND_MAIL = r'(?P<mail>[\w\-][\w\-\.]+@[\w\-][\w\-\.]+)' 

FIND = re.compile(r'%s|%s' % (FINDJ.INK, FIND_MAIL) , re. I | re.M) 

IS_LINK = re.compile(FIND_LINK, re. I) 

REPLACE_LINK= r'<a href="%(li nk)s" target="_blank">%(1ink)s</a>' 

REPLACE_MAIL = r'<a href="mail to:%(mail)s">%(mail )s</a>' 

def _repl ace (match) : 

value = match. groupO 

if IS_LINK.search(va"lue) is not None: 

res = REPLACE_LINK % match .groupdi ct() 
else: 

res = REPLACE_MAIL % match .groupdi ct() 
print('%s -> %s' % (value, res)) 
return res 

if name == ' main ': 

filename = sys.argv[l] 

text = open(filename) . read() 

with open(' res_%s' % filename, 'w') as result: 
result .write (FIND. sub(_replace, text)) 



Discussion 

Lorsque la manipulation de texte devient un peu plus complexe que de simples 
recherches de sous-sequences constantes de caracteres, les expressions regulieres sont 
alors incontournables. Elles recherchent des motifs grace a un langage de description 
complet qui decrit les motifs de texte a retrouver. 
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Le module re fournit une fonction de substitution sub qui remplace toutes les occur- 
rences d'un motif par une autre valeur, en fournissant une chaine de caracteres ou 
une fonction a appeler, comme c'est le cas dans l'exemple. 

Toute la difficulte d'un tel exercice reside dans la conception des expressions regu- 
lieres. Un programme comme Kodos (http://kodos.sourceforge.net) aide a retrouver la 
bonne expression par une serie d'essais et d'erreurs. 

Extension 

Le programme part du principe que le texte fourni n'a aucune balise HTML. Si c'est 
le cas, et si certains liens sont deja garnis de balises <a>, la transformation aura un 
effet pervers. 

Limites du script 

$ more text.txt 

Mon e-mail est tarek@ziade.org et mon site http://programmation-python.org. 

$ python ex3.py text.txt 

tarek@ziade.org -> <a href="mailto:tarek@ziade.org">tarek@ziade.org</a> 
http://programmation-python.org. -> <a href="http://programmation- 
python . org . " target="_bl ank">http : //programmati on -python . org . </a> 

$ more res_text.txt 

Mon e-mail est <a href="mailto: tarek@ziade.org">tarek@ziade.org</a> et 

mon site <a href="http://programmation-pytho 

n . org . " target="_bl ank">http : //programmati on -python . org . </a> 

$ python ex3.py res_text.txt 

tarek@ziade.org -> <a href="mailto:tarek@ziade.org">tarek@ziade.org</a> 
tarek@ziade.org -> <a href="mailto:tarek@ziade.org">tarek@ziade.org</a> 
http://programmation-python.org." -> <a href="http://programmation- 
python .org. "" ta rget="_bl an k">http: //programmati on -python. org. "</a> 
http://programmation-python.org. -> <a href="http://programmation- 
python . org . " target="_bl ank">http : //programmati on -python . org . </a> 

$ more res_res_text.txt 

Mon e-mail est <a href="mailto:<a 

href="mai 1 to : tarek@zi ade . org">tarek@zi ade . org</a>"xa 

href="mai 1 to : tarek@zi ade .or 

g">tarek@ziade.org</ax/a> et mon site <a href="<a href="http:// 

programmati on -python . org . " " target="_bl ank">http : // 

programmation-python.org. "</a> target="_blank"xa href="http:// 

programmati on -python . org . " target="_bl ank">http : //pr 

ogrammati on -python . org . </ax/a> 
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Une extension possible serait d'enrichir 1' expression reguliere pour ajouter des condi- 
tions sur le texte situe avant et apres le lien. 

Exercice 4 : trier des phrases suivant le nombre de mots 

Description 

L'objectif de 1' exercice 4 est de trier des phrases en fonction du nombre de mots qu'elles 
contiennent, sans compter la ponctuation, ni les mots de taille inferieure ou egale a 
2 lettres. Le tri obtenu doit rester constant, c'est-a-dire que deux phrases contenant le 
meme nombre de mots doivent toujours etre ordonnees de la meme maniere. 

Points abordes 

Tri etle module itertools. 



Solution 

Tri en fonction du poids des phrases 

#! /usr/bi n/python 

# -*- coding: utf8 -*- 

from string import punctuation 

from string import maketrans 

from itertools import imap 

NO_PUNCT = maketrans (punctuati on , 



Ten (punctuation)) 



def clean_line(line) : 

"""Nettoie la phrase, et renvoi e son 'Poids'' 
line = line.translate(NCLPUNCT) 
cleaned_line = [] 
for word in line.split() : 

word = word.stripO 

if 1 en (word) < 2: 
continue 

cl eaned_l i ne . append (word) 
numwords = len(cleaned_line) 
return numwords, ' ' . join(cleaned_line) 

def cmp_lines(linel, line2): 

"""Compare les poids des phrases. 

En cas d'egalite, l'ordre alphanumerique. 
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same_size = cmp("linel[0] , line2[0]) 
if same_size == 0: 

return cmp(~linel[l] , line2[l]) 
return same size 

def print_sorted_text(text) : 

""" renvoie un tri en fonction du nombre de mots """ 
print('Resultat: ') 

for numwords, line in sorted(imap(clean_line, text), cmp=cmp_lines) : 
print('%s (%d)' % (line, numwords)) 

def get_text() : 

print('Saisissez des phrases (une ligne vide pour terminer): ') 
text = [] 
while True: 

line = raw_input() 
if line == ": 

break 
text . append (1 i ne) 
return text 

if name == ' main ' : 

pri nt_sorted_text(get_text()) 

Discussion 

Des qu'une meme operation doit etre appliquee a une sequence, imap() est un bon 
moyen de reduire la complexite du code. II renvoie un generator sur chaque element 
d'une sequence apres lui avoir applique la fonction cl ean_l i ne. 

Ici, le fait d'utiliser un generator n'apporte rien de plus qu'une liste comprehension, 
si ce n'est que la taille memoire utilisee pour le traitement reste basse et stable, quelle 
que soit la taille du tableau en entree. Mais utiliser imap dans une directive for ame- 
liore considerablement la lisibilite et la longueur du code. 

La fonction sorted() reduit egalement le code necessaire a un tri efficace, puisque 
dans notre cas, seule la fonction de comparaison est fournie et le reste est pris en 
charge par la primitive. Cette derniere utilise la primitive cmp, qui renvoie 0, -1 ou 1 
a sorted (), qui se base sur i'algorithme de tri rapide quicksort. 

Enfin string. maketrans utilise ici string. punctuation pour nettoyer les phrases 
efficacement, avant d'en extraire les mots. 

Extension 

Sans objet 
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Fichiers 

Exercice 5 : recherche et remplacement de texte 

Description 

L'objectif de cet exercice est de rechercher et remplacer un texte dans un fichier texte 
donne. Le texte a rechercher peut apparaitre plusieurs fois dans le fichier et est fourni 
sous la forme d'une expression reguliere. 

Points abordes 

Expressions regulieres, lecture et ecriture de fichiers, with. 

Solution 

Search and replace 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

import sys 

import os 

import re 

usage = """\ 
Utilisation : 

%(prog)s <fichier> <expression> <substitut> 
Par exemple: 

%(prog)s pim.txt pam poum 
Remplacera toutes les occurences de "pam" en "poum" 

def sub_text(path, expr, repl): 

""" remplace un texte dans un fichier """ 

# remplacement 
with open(path) as source: 

with open('%s.tmp' % path, 'w') as target: 

target. write(re.sub(expr, repl, source. read())) 

# renommage si tout s'est bien passe 
os. rename(path, '%s~' % path) 
os. rename ('%s.tmp' % path, path) 
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if name == ' main ' : 

if len(sys.argv) != 4: 

print(usage % {'prog': sys.argv[0] }) 
sys.exit(O) 

sub_text(*sys. argv [1:4]) 

Discussion 

Lecture des arguments 

Le module sys contient un attribut global argv de type liste qui est initialise 
lorsqu'un script Python est execute depuis le shell, argv contient tous les arguments 
passes en parametres lorsque le script est execute. Si Ton sauvegarde un script dans 
un fichier nomme argv . py qui contient : 

fichier argv.py 

import sys 
print(sys .argv) 

Son execution affichera tous les arguments fournis au script, le premier etant le nom 
du fichier lui-meme : 

Execution de argv.py 

$ python argv.py 

['argv.py'] 

$ python argv.py un deux trois 

['argv.py', 'un', 'deux', 'trois'] 

with pour la manipulation de fichiers 

Lorsqu'un objet fichier est genere par le biais de la primitive open () ou f i 1 e () , il est 
necessaire d'appeler la methode cl ose () a la fin du traitement. 

Le pattern qui convient pour manipuler des fichiers est done : 
Manipulation de fichier avec try..finally 

f = open(path, 'w') 
try: 

f .write(content) 
f i nal 1 y : 

f.closeQ 
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Mais wi th offre un mecanisme equivalent et plus concis. II se charge de fermer l'objet 
fichier quoi qu'il advienne. 

Manipulation de fichier avec with 

with open(path) as f: 
f .write(content) 

Extension 

Un mode interactif de remplacement et un mode qui ne donne que la liste des ele- 
ments interceptes dans le texte sans le modifier peuvent rendre l'utilisation de ce pro- 
gramme plus souple. 

Exercice 6 : recopie conditionnelle et recursive de fichiers 

Description 

L'objectif de 1' exercice 6 est de recopier une arborescence de fichiers et de dossiers, en 
parcourant recursivement les sous-dossiers. De plus, les fichiers dont l'extension est 
. pyc ne doivent pas etre copies. 

Points abordes 

Le module shutil. 

Solution 

Recopie conditionnelle 

#!/usr/bin/python 
# -*- coding: utf8 -*- 
import shutil 
import sys 

def copytree(src, dst) : 

"""Recopie une arborescence, en ignorant les fichiers .pyc""" 
shutil .copytree(src, dst, ignore=shutil .ignore_patterns(' * . pyc')) 

if name == ' main ': 

copytree(sys .argv[l] , sys.argv[2]) 
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Discussion 

shutil .copytree est une fonction tres puissante pour recopier une arborescence de 
fichiers. Le parametre ignore prend une fonction qui recoit, pour chaque dossier traverse 
par copytree, la liste des elements. Elle doit retourner les elements a ne pas recopier. 

ignore_patterns est une fonction fournie dans shutil qui peut etre utilisee pour 
ignore. Elle filtre les fichiers qui correspondent aux expressions fournies, les expres- 
sions etant de type glob-style. 

II vaut mieux preferer cette technique a une boucle basee sur os .wal k. 

Exercice 7 : ajout d'un fichier dans une archive zip 
Description 

L'objectif de 1' exercice 7 est de creer un utilitaire qui liste les fichiers contenus dans 
une archive zi p fournie en argument, et ajoute un fichier dans l'archive lorsqu'il est 
passe en deuxieme argument. 

Points abordes 

Le module zi pf i 1 e et la variable globale doc . 

Solution 

Manipulations de fichiers zip 

#!/usr/bin/python 

# -*- coding: ISO-8859-15 -*- 

\ 

Deux utilisations possibles: 

o si seule l'archive est fournie en argument, 
la liste des fichiers contenus est affichee 

o si un fichier est aussi fourni , il est insere dans l'archive 
si l'archive ne possede pas deja un fichier sous ce nom puis 
affiche la liste des fichiers 

Utilisation: %(prog)s <nom de l'archive> [nom du fichier] 

import sys 

import os 

from zipfile import ZipFile, is_zipfile 
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def add_to_zip(zip, path): 

"""Ajoute un fichier dans une archive zip.""" 

zip = ZipFile(zip, mode="a") 

try: 

if path not in zip. name"! ist() : 
zip.write(path , path) 
return True 
return False 
f i nal 1 y : 

zip.close() 

def print_zip(zip) : 

"""Affiche le contenu d'un fichier zip.""" 

zip = ZipFile(zip) 

try: 

print 'Contenu de %s:\n' % zip.filename 

zip.printdi r() 

print '%d fichier(s)' % len(zip.filelist) 
finally: 

zip.closeQ 



if name == ' main ': 

if len(sys.argv) < 2: 

print( doc % {'prog': sys.argv[0]}) 

sys.exit(O) 

zip = sys.argv[l] 

if not is_zipfile(zip) : 

print('"%s" n\'est pas un fichier zip' % zip) 

sys.exit(O) 

if len(sys.argv) > 2: 

if not add_to_zip(zip, sys.argv[2]) : 

print(' Fichier avec le meme nom deja existant') 
else: 

print(' Fichier ajoute') 
else: 

print_zip(zip) 



Discussion 

Lorsqu'aucun fichier a aj outer n'est fourni, le programme se contente de fournir la 
liste des fichiers de l'archive. 

Le module zipfile fournit, outre la classe ZipFile, une petite fonction utilitaire 
is_zipfile() qui permet de tester un fichier pour savoir si c'est une archive zip. 
L'information est lue dans les premiers octets du fichier. 
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Enfin, le docstring du module, accessible dans les variables globales avec doc , a 

ici un double role : il documente le module et s'affiche lorsque le nombre d'argu- 
ments passes au script est insuffisant. 

Extension 

La methode printch'rO du module zipfile definit en dur le nom des en-tetes du 
tableau de fichiers affiches : 

Methode printdir() de la classe ZipFile 

def printdi r(self) : 

"""Print a table of contents for the zip file.""" 

print "%-46s %19s %12s" % ("File Name", "Modified ", "Size") 

for zinfo in self .fi lei ist: 

date = "%d-%02d-%02d %02d:%02d:%02d" % zinfo.date_time 

print "%-46s %s %12d" % (zi nfo.fi lename, date, zinfo. file_size) 

La mise en page ne fonctionne pas avec des fichiers dont le chemin complet fait plus 
de 46 caracteres. 

Sans entrer dans les details des mecanismes de l'internationalisation, on peut d'ores 
et deja utiliser une version personnalisee de la classe ZipFile pour afficher les 
en-tetes en francais et en profiter pour y integrer la derniere ligne qui affiche le 
nombre de fichiers, ainsi qu'une mise en page un peu plus robuste. 

Version francaise de ZipFile 

FILENAME = 'Nom fichier' 

MODIFIED = 'Modifie' 

SIZE = 'Taille' 

FILES = 'fichier(s)' 

HEADER = '%-46s %19s %12s' % (FILENAME, MODIFIED, SIZE) 

class ExtendedZipFile(ZipFile) : 
def printdi r(self) : 

"""Print a table of contents for the zip file.""" 
print(HEADER) 
print(len(HEADER) * '-') 
for zinfo in self .filelist : 

date = '%d-%02d-%02d %02d:%02d:%02d' % zinfo.date_time 
filename = zinfo.filename 
if 1 en (filename) > 40: 

filename = '...%s' % filename [-40:] 
print('%-46s %s %12d' % (filename, date, zinfo. file_size)) 
print(len(HEADER) * '-') 
print('%d %s' % (len(self .filelist) , FILES)) 
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Threads et processus 

Exercice 8 : Tkinter, recherche d'un texte dans des fichiers en tache de 
fond 

Description 

Cet exercice propose d'aborder l'utilisation des threads avec un probleme recurrent 
des lors que Ton aborde la programmation d'interfaces graphiques : certains traite- 
ments prennent trop de temps pour que Ton puisse se permettre de laisser l'interface 
utilisateur inactive et bloquee. 

L'objectif de l'exercice est de concevoir une petite interface basee sur Tkinter qui per- 
mette a l'utilisateur de saisir un chemin et un texte (expression reguliere). Le pro- 
gramme doit parcourir recursivement tous les fichiers du chemin et afficher dans la 
fenetre graphique les fichiers qui contiennent le texte saisi. 

Ces fichiers doivent apparaitre au fur et a mesure que le programme les trouve. 
Points abordes 

Interface Tki nter, les threads 

Solution 

Recherche en tache de fond avec interface Tkinter 

#! /usr/bi n/python 

# -*- coding: utf8 -*- 
import os 

from os import walk 
from re import compile 
from threading import Thread 

from Tkinter import * 
from Tkconstants import * 

DEFAULT_BUFSIZE = 8*1024 

# 

# Thread de recherche 
# 
class SearchThread(Thread) : 

""" Thread de recherche de texte 
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def "init (self, path, text, percent, callback): 

Thread. init (self) 

self. path = path 
self. text = text 
self. percent = percent 
self .callback = callback 
self. buffer = DEFAULT_BUFSIZE 
self. running = False 
self.exts = ('.txt', '.py') 

def stop(self) : 

"""Arrete le thread.""" 
if self. running: 

self. running = False 

def run(self) : 

"""Methode lancee par start().""" 
path = self. path 
text = self. text 
found = 

self. running = True 
for root, reps, files in walk(path): 
if not self . running: 

break 
for index, file_ in enumerate (files) : 
ext = os. path. spli text (file_) [-1] 
if ext not in self.exts: 

continue 
if not self . running: 

break 
self.percent('Recherche %d/%d: %s/%s' \ 

% (index, 1 en (files), root, file_)) 
full name = '%s/%s' %(root, file_) 
if self . text_in_fi le(full name, text): 
self.callback('%s' % fullname) 
found += 1 
if found == 0: 

self .callback('Aucun fichier') 
self . percent('%d fichiers(s) trouve(s)' % found) 

def text_in_file(self , file_, text): 

"" "Renvoi e vrai si le file_ contient le text. 

Lis le text par morceaux pour limiter la taille 

memoi re. """ 

ctext = compile (text) 

try: 

f = open(file_, 'r', buffering=self .buffer) 
except IOError: # en cas de pb d'acces (droits, etc.) 

return False 
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with f: 

line = None 
while line != ' ' : 

if not self . running: 

return False 
line = f. readline(self. buffer) 
if ctext. match (line) is not None: 
return True 
return False 
# 

# Frames 
# 
class FramePath(Frame) : 

def init (self, root): 

Frame . i ni t (sel f ) 

label = Label (self, text="Chemin de recherche") 

label .pack(fill=X, expand=l) 

self. path = Entry(self, name="path") 

self. path . pack(f i 1 1 =BOTH) 

self .path. insert (0, os.path . expanduser ('-')) 

self . path. select_range(0, END) 

class FrameText (Frame) : 

def init (self, root): 

Frame . i ni t (sel f ) 

self. label = Label (self, text="Texte a rechercher") 

self .label .pack(fill=X, expand=l) 

self. text = Entry(self, name="text") 

self. text . pack(f i 1 1 =B0TH) 

self .text. insert(0, ' ') 

self .text. select_range(0, END) 

class FrameButton(Frame) : 

def init (self, root): 

Frame . i ni t (sel f ) 

def create_elements(self , stop_command, search_command, 

close_command) : 
self. button = Button(self ,text="Stop" , 

command=stop_command) 
self .button. pack(side=RIGHT, padx=5, pady=5) 
self. button = Button(self ,text="Rechercher" , 
command=search_command) 
self .button. pack(side=RIGHT, padx=5, pady=5) 
self.button3 = Button(self , text="Fermer" , 

command=cl ose_command) 
self .button3.pack(side=RICHT) 
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class FrameResult(Frame) : 

def "init (self, root): 

Frame . i ni t (sel f ) 

self . resu"lts_window = Listbox(self) 

self . resultats_ascenseur = Scrollbar(self , orient=VERTICAL, 

command=sel f . resul ts_wi ndow. yvi ew) 
self. resul ts_wi ndow. conf i gCyscrol 1 command=\ 

self. resul tat s_ascenseur. set) 

self . results_window. pack(side=LEFT, expand=l, fill=BOTH) 
self. resultats_ascenseur.pack(side=RICHT, fill=Y) 

# 

# Application 

# 

class Application (object) : 

""" Frame contenant l'interface de recherche 

et d'affichage des resul tats 

def init (self): 

self._tk = Tk() 

# creation des 4 frames 

options = {'expand': 1, 'fill': BOTH} 

self .add_f rame('f rm_path' , FramePath, ""options) 

self .add_f rame('f rm_text ' , FrameText, "'"-options) 

self .add_f rame('f rm_bouton ' , FrameButton, "-■•options) 
sel f . f rm_bouton . create_el ements (sel f . stop_search , 

self .search, 
self .close) 

self .add_f rame('f rm_result ' , FrameResult, ••■•options) 
#, 'relief: RIDGE 
self .searcher = None 

# titre fenetre application 
self ._tk.wm_title(' Recherche') 

def mainloop(self) : 

self ._tk.mainloop() 

def add_f rame(self , name, class_, **pack_options) : 
instance = class_(self ._tk) 
setattr(self , name, instance) 
i nstance . pack(* *pack_opti ons) 

def _callback(self , msg) : 

"""Appelee par le thread.""" 

sel f . f rm_resul t . resul ts_wi ndow . i nsert (END , msg) 
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def _percent(self , msg) : 

""" appelee par le thread """ 
self ._tk.wm_ti tie (msg) 

def search(self) : 

"""Lance une recherche.""" 
self. stop_search() 

self .f rm_result . results_window.delete(0, END) 
path = self .frm_path. path. get() 
text = self .f rm_text. text. get () 

# lance le thread de recherche 

self . searcher = SearchThread(path , text, self ._percent, 

self ._callback) 
self. searcher. start () 

def stop_search(self) : 

"""Stoppe une eventuelle recherche en cours.""" 
if self . searcher is not None: 
self .searcher. stopO 

def close(self) : 

"""Demande de fermeture, arret d'une eventuelle recherche.""" 
self. stop_search() 
self ._tk. destroy () 

name == ' main ': 

app = Application() 
app.mainloopQ 



Discussion 

Le code est separe en deux parties distinctes, a savoir : 

• Une classe de thread appelee SearchThread, en charge de la recherche sur le dis- 
que, qui pourrait etre utilisee dans un autre contexte. 

• La couche superieure qui gere l'interaction avec l'utilisateur, et pilote une instance 
du thread de recherche. 

Le thread renvoie les resultats pour affichage au fur et a mesure qu'il les trouve. II n'y 
a pas de precaution necessaire dans notre cas, car seul le thread en cours de recherche 
manipule la methode d'affichage. 



Extension 

Lorsqu'une application graphique a un besoin recurrent de traitements asynchrones, 
il peut etre interessant de mettre en place un pattern producteur-consommateur 
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appele producer-consumer. Le principe de ce design pattern est de fournir a 1' applica- 
tion une file d'attente pour les traitements : chaque traitement a executer en tache de 
fond est ajoute dans la file d'attente et un ou plusieurs threads, nommes workers, se 
chargent de la tache. 

En plus de rendre l'interface a l'utilisateur, cette parallelisation multiple accelere le 
traitement. 

Exercice 9 : Un web spider rapide 

Description 

L'objectif de cet exercice est de mettre en place le modele producteur-consomma- 
teur, presente dans l'extension de l'exercice precedent, en utilisant des processus. 

Le programme doit lancer en parallele 4 processus en charge de trouver des pages web 
qui contiennent un mot. Le systeme est amorce avec une dizaine de pages que les pro- 
cessus visitent. A chaque page visitee, le processus suit les liens et visite au maximum 
50 pages. Si une page a deja ete visitee par un autre processus, elle ne le sera pas de nou- 
veau. Un systeme de journal doit aussi afficher les URL scannees au fur et a mesure. 

Points abordes 

Les modules multiprocessing, urllib2 et module logging. 

Solution 

Producteur-consommateur 

#!/usr/bin/python 

# -*- coding: ISO-8859-15 -*- 
import os 
import urllib2 
import sys 
import logging 

from multiprocessing import Pool 
from multiprocessing import TimeoutError 
from multiprocessing import Manager 

processecLurls = ManagerO .dict() 

# mise en place du logger 
logger = logging. getLogger('WebLogger') 
1 ogger . setLevel (1 oggi ng . INFO) 
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# mise en place du handler 
handler = logging. StreamHandlerO 
logger.addHandler (handler) 

def get_page(url) : 

"""Extrait le contenu et les liens""" 
# VOIR EXERCICE 12 
return ' ' , [] 

def process_url (query, url): 

"""Traite une page et ses liens""" 
logger .info(' Processing %s' % url) 

if len(processed_urls) >= 100: 

return 
if url in processed_urls: 

return 
try: 

content, links = get_page(url) 

processed_urls[url] = query in content 

for link in links: 

process_url (query , url) 
except TimeoutError : 

pass 

def launch_work(query, urls): 

logger .info(' Launching process') 

pool = Pool (4) 

try: 

results = [pool .apply_async(process_url , (query, url)) 

for url in urls] 
for res in results: 
res.getO 
finally: 

pool .close() 

pool . join() 

logger .info('Done. ') 

URLS = ['http://python.org',] 

if name == ' main ': 

launch_work(sys.argv[l] , URLS) 

for url, found in processed_urls.items() : 
if not found: 
continue 
print url 
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Discussion 

Ajoute a la version 2.6, le module multiprocessing gere les processus aussi souple- 
ment que des threads. Les API disponibles sont equivalentes aux API du module 
threading. En outre, multiprocessing propose une classe Pool qui gere automati- 
quement les processus et les taches a realiser. 

Dans la fonction launch_work, une instance de Pool est creee et chaque URL a 
traiter est passee a cette classe avec la requete de recherche. 

Le travail consiste ensuite a programmer la fonction qui traite FURL de maniere 
isolee sans se soucier de l'aspect multiprocessus. Une fois l'instance de classe Pool 
remplie, chaque tache est executee par l'appel get. 

processecLurl est un dictionnaire partage entre les differents processus, qui liste les 
URL deja traitees, de maniere a ne pas repasser par les memes pages. 

La suite est une programmation classique, ou les pages sont lues avec 
u rill ib2.url open et les logs ends avec logging. La lecture des pages n'est pas 
decrite ici, car cette fonctionnalite est detaillee dans l'exercice 12. 

Extension 

La programmation parallele est utile lors qu'un programme manipule des ressources 
distantes, comme des pages web. Mais si ce modele accelere grandement les traite- 
ments, pour un volume consequent de donnees, il atteint ses limites car il n'est pas 
possible de lancer une quantite infinie de processus sur la meme machine. 

Le fait d'isoler le travail de recherche dans une fonction unique permet assez facile- 
ment de passer a des modeles distribues plus robustes. Le programme ci-avant peut 
par exemple evoluer vers un programme qui s' execute en parallele sur plusieurs 
machines (appeles nceuds). Dans ce modele, le pool devient le noeud maitre, et 
l'ensemble est appele cluster. Le noeud maitre envoie des travaux independants a 
chaque noeud du cluster et recupere les resultats. 

Lalgorithme le plus celebre de modele distribue de ce type est MapReduce (http:// 
fr.wikipedia.org/wiki/MapReduce) de Google. Cote implementation, la plus celebre est 
Hadoop en Java. Notons que quelques implementations existent en Python, comme 
Disco (http://discoproject.org/). 
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Persistance 



Exercice 10 : rendre persistants tous les objets d'un programme 

Description 

L'objectif de cet exercice est de mettre en place un mecanisme qui rende persistantes, 
de maniere transparente, toutes les instances de classes derivees d'une meme classe de 
base dans un programme. 

A chaque fois que le programme se termine, les objets sont sauvegardes sur le sys- 
teme de fichiers. lis peuvent ensuite etre recharges grace a un identifiant unique qui 
leur est attribue. 

Points abordes 

shelve, atexit 

Solution 

Programme persistant 

#! /usr/bi n/python 
# -*- coding: utf8 -*- 
import shelve 
import atexit 

data = None 
objects = [] 

def _load_objectsO : 
print(' Loading. . . ') 
global data 
data = shelve.openCobjects.bin ') 

def _save_objects() : 
print('Saving. . . ') 
for ob in objects: 

data[ob._id] = ob. diet 

data.close() 

class Persistent(object) : 

def new (els, id_): 

ob = super(Persi stent , els). new (els) 
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if id in data: 

ob. diet = data[id_] 

objects . append(ob) 
return ob 

def init (self, id_): 

self._id = id_ 

# chargement des objets 
_load_objects() 

# _save_objects sera appelee a la fermeture du programme 
atexit . register(_save_objects) 

Discussion 

Au chargement du module, shelve charge les donnees sauvegardees, puis les rend 
disponibles a chaque instance. La classe de base Persistent charge les donnees sau- 
vegardees dans son attribut diet , puis s'enregistre comme instance. 

Lorsque le programme se termine, les donnees de chaque instance sont serialisees 
grace a un appel provoque par atexi t. 

Exemple de programme utilisateur 

from exlO import Persistent 
import random 

class MyCl ass (Persi stent) : 

def some_code(self , value): 
self. value = value 

test = MyClass('the id') 

try: 

print('ancienne valeur %s ' % test. value) 
except AttributeError: 

print('ancienne valeur : aucune') 

test .some_code( random. randint(l, 1000)) 
print('nouvelle valeur %s ' % test. value) 

Chaque instance de MyClass est associee a un identifiant unique, et serialisee par 
shelve. 
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Executions du programme 

$ python exemple_exl0.py 
Loading. . . 

ancienne valeur : aucune 
nouvelle valeur 255 
Savi ng . . . 

$ python exemple_exl0.py 
Loading. . . 
ancienne valeur 255 
nouvelle valeur 402 
Savi ng . . . 

Extension 

Le mecanisme presente ne sauvegarde les donnees qua la fermeture du programme. 
Cependant, dans certaines situations, il peut etre interessant de provoquer cette sauve- 
garde a chaque modification de donnees. En outre, aucune protection n'est mise en 
place pour les objets qui ne peuvent pas etre serialises, comme les locks ou les threads. 
Dans ce cas, une exception sera levee par shelve. Enfin, ce systeme de sauvegarde 
n'est fonctionnel que si le code de la classe associe aux instances ne change pas. En cas 
de modification, la sauvegarde sera caduque, et il faudra prevoir une migration. 

Une autre extension possible est de conserver l'etat precedent de l'objet au moment 
d'une nouvelle sauvegarde et d'etre ainsi en mesure de revenir en arriere dans l'histo- 
rique des modifications. 

Ces principes peuvent etre etendus par la mise en place d'un systeme de transaction, 
global au programme. 

La ZODB (Zope Object Database, la base de donnees objet de Zope) est un bon 
exemple de cette mecanique. 



Web et reseau 

Exercice 1 1 : verificateur de liens 
Description 

L'objectif de l'exercice est de fournir un outil qui verifie qu'une adresse URL donnee 
est valide, et renvoie la date de derniere modification et le type de contenu. 
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Points abordes 

ur"llib2. 

Solution 

Verificateur de liens 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

import urllib2 

def check_url (ur"l) : 

req = ur"llib2 .Request(url) 
try: 

url_handle = url"lib2 .urlopen(req) 
except url"lib2 .URLError: 

return None, None 

headers = url_handle.infoO 

return headers[' Content-Type'] , headers ['Date'] 

Discussion 

ur"llib2 recupere directement les en-tetes d'une URL pour analyse. II le fait sans 
recuperer le contenu integral de l'URL, ce qui permet de rendre la recuperation du 
contenu conditionnelle. Par exemple, si la page est regulierement recuperee, le pro- 
gramme peut verifier si la date de modification a change avant de recuperer le nou- 
veau contenu. 

Extension 

Ce genre de fonctionnalite peut etre couple avec le prochain exercice, pour fournir un 
systeme de mise a jour de page, ou le contenu n'est rapatrie que s'il differe d'un con- 
tenu recupere au prealable. 



Exercice 12 : aspirateur de page web 



Description 

Un aspirateur de page web doit : 

• recuperer la page ; 

• parcourir son contenu et recuperer toutes les composantes necessaires a i'affichage 
de la page (images, feuilles de style, etc.). 
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Les liens ne sont pas suivis et kisses tels quels. 
Points abordes 

ur"l"lib2, SGMLParser, creation de fichiers. 



Solution 

Aspirateur 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

import sys 

import os 

import urllib2 

import logging 

from url parse import url split 

from urlparse import urlunsplit 

from os. path import join 

from HTMLParser import HTMLParser 

from sgmllib import SGMLParser 

class PageParser(SGMLParser) : 

"""Parse une page web et collecte ses liens 

def init (self, on_attribute_visited, tags_to_remove=('base' ,)) : 

SGMLParser. init (self) 

self .on_attribute_visited = on_attribute_visited 
self . tags_to_remove = tags_to_remove 

def unknown_starttag(self , tag, attrs) : 
if tag.lower() in self . tags_to_remove: 

return None 
final_tag = '<%s' % tag 
for nom_attr, val_attr in attrs: 

val_attr = self .on_attribute_visited(tag, nom_attr, val_attr) 
final_tag += ' %s="%s" ' % (nom_attr, val_attr) 
final_tag += '>' 
self ._result. append (final _tag) 

def unknown_endtag(self , tag): 

if tag.lower() in self .tags_to_remove: 

return None 
self ._result . append ('</%s>' % tag) 

def parse(self, data): 
self._result = [] 
self .feed (data) 
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return ' ' . join(self ._result) 

def hancne_data(self , data): 
self ._result. append (data) 

def handle_comment(self , comment): 

self ._result.append('<! -- %s -->' % comment) 

def handle_entyref (self , ref) : 

x = ';&apos; * ref in self .entitydefs 
self ._result.append('&%s%s' % (ref, x)) 

def handle_charref (self , ref): 

self._result.append('&#%s' % ref) 

class WebPage(object) : 

"""Pointe une page web et permet sa serialisation 

def init (self, url): 

self.url = url 

def _get_content(self , url): 
req = urllib2 . Request(url) 
try: 

return urllib2 .url open (req) . read() 
except urllib2 .URLError: 

return ' ' 

def _clean_url (self , url): 

scheme, netloc, path, query, fragment = urlsplit(url) 
if scheme == ' ' : 

scheme = 'http' 
return urlunsplit((scheme, netloc, path, query, fragment)) 

def _replace_source(self , source): 
source = self ._clean_url (source) 
if source not in self, media: 

filename = join('_files' , 'file_%s' % self._count) 

self ._media[source] = filename 

content = self ._get_content(source) 

with open(filename, 'w') as f: 
f .write(content) 

self._count += 1 
return self ._media[source] 

def _media_needed(self, tag, attribut, valeur): 

"""Telechargement et modification du lien si necessai re. """ 
if (tag.lower() in ('img', 'link', 'script') and 
attribut. lower() in ('href, 'src')): 
return self ._replace_source (valeur) 
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return valeur 

def download (self, filename=None) : 

"""Recupere la page web et les pieces dependantes""" 

self._count = 

self._media = {} 

scheme, netloc, path, query, fragment = urlspl"it(self .url) 

self.urlbase = '%s://%s' % (scheme, netloc) 

logging. info(' Recuperation de %s' % self. url) 
try: 

content = self ._get_content(self. url) 
except urllib2 .URLError: 

logging. info("Impossible de lire l'url %s" % self. url) 

raise 

# creation d'un sous-dossier 

if not os.path.exists('_files') : 
os.mkdi r('_files') 

# parcours de la page pour remplacer et telecharger 

# les images 

parser = PageParser(self ._media_needed) 
content = parser. parse(content) 

# sauvegarde de la page 
if filename is None: 

filename = path.split(V') [-1] 
if filename == ' ' : 

filename = '%s.htlm' % netloc 
with open(filename, 'w') as f: 
f .write(content) 

logging. info(' Fichier "%s" cree' % os .path.basename(filename)) 

if name == ' main ': 

if len(sys.argv) != 2: 

print('Utilisation: %s <url>' % sys.argv[0]) 
sys.exit(O) 
url = sys.argv[l] 
my_page = WebPage(url) 
my_page . downl oad () 

Discussion 

La classe PageParser derive de sgmlib.SCMLParser qui est un simple parseur 
SGML, compatible avec tout texte contenant des balises. Ce parseur a ete choisi 
pour ne pas souffrir des restrictions des parseurs HTML classiques comme 
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HTMLParser, qui ne sont compatibles qu'avec le XHTML strict, c'est-a-dire qui ne 
supportent pas qu'une balise ne soit pas correctement fermee. 

Le principe du parseur est de parcourir le contenu et de provoquer un appel a des 
methodes de la classe a chaque fois qu'une balise est rencontree. 

Page Parser surcharge ces methodes et alimente en interne une liste qui contient le con- 
tenu de la page. Elle fournit en outre un point d'entree on attribute_visited, pour 
qu'une classe exterieure (un visiteur), puisse modifier a la volee un attribut d'un tag. 

La classe PageWeb joue ce role de visiteur et gere les echanges avec le serveur, en tele- 
chargeant a la volee les differentes composantes qui affichent une page, comme les 
images et les feuilles de style. 

Un petit cache interne evitent de telecharger le meme fichier plusieurs fois, et un 
sous-dossier est cree pour contenir ces elements. 

Extension 

La premiere extension qui vient a l'esprit est de creer un aspirateur recursif, en sui- 
vant les liens de la page. 

Une autre extension interessante consiste a utiliser ce genre d'outil pour filtrer le con- 
tenu des fichiers, puisque le parseur nous permet de parcourir facilement les tags. Un 
serveur proxy peut par exemple utiliser cet outil pour remplacer toutes les URL vers 
des sites non autorises par un lien vers une page interne d'avertissement. 

Exercice 13 : recuperation d'un resume des nouveaux e-mails recus 

Description 

Lobjectif de l'exercice 13 est de fournir un utilitaire capable de se connecter a un ser- 
veur IMAP pour recuperer la liste des nouveaux e-mails recus et afficher le sujet et 
l'auteur des 5 derniers e-mails non lus. 

Points abordes 

imaplib. 

Solution 

Les 5 derniers e-mails 

#!/usr/bin/python 

# -*- coding: ISO-8859-15 -*- 

from optparse import OptionParser 
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import sys 

import imaplib 

import socket 

from email import Message 

from email. Errors import HeaderParseError 

from email .Header import decode_header as decoder 

from email. Header import make_header 

from encodings import exceptions as exceptions_codage 



options 



[] 



def decode_header(header, encoding='utf8') : 

"""Renvoie un en-tete encode avec le meme codec.""" 
try: 

header_decode = decoder(header) 
except HeaderParseError: 

return header 

unified = [(decoded, encoding) for decoded, charset in 
header_decode] 

return uni code (make_header (unified)) 

class TextMessage(object) : 

"""Permet de renvoyer le texte a l'envers, en utilisant 

un separateur de ligne specifique en lecture et \n en sortie. 

def init (self, text): 

self. lines = text. split('\015\012') 
self. lines. reverse () 

def readline(self) : 
try: 

return '%s\n' % self .lines .pop() 
except IndexError: 

return ' ' 

def get_mai Is (server , user, password): 

"""Renvoie le sujet et l'auteur des 5 derniers e-mails non lus""" 
imap = imaplib.IMAP4_SSL(server) 
imap.login(user, password) 
try: 

imap.select('INBOX') 

status, uids = imap.uid('search' , 'UNSEEN') 
if status != 'OK' : 

logging. debug('Impossible de recuperer les informations') 

sys.exit(O) 

uids = uids[0] .split(' ') 
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for index, uid in enumerated(reversed(uids)) : 
uid = uid.stripO 
if index == 5: 

break 
if uid == ": 
continue 
status, res = imap.uid('fetch ' , uid, 

'(BODY. PEEK [HEADER. FIELDS (From Subject)])') 
if status != 'OK' : 

logging. debug ('Impossible de lire le mail n°%s' % uid) 
continue 
message = Message(TextMessage(res[0] [1]) , 0) 
subject = decode_header(message['subject']) 
from_ = decode_header(message['f rom']) 
yield '%s (%s) ' % (subject, from_) 
finally: 

imap. close () 

def main(options , arguments, parser): 
if len(arguments) != 3: 

print (parser. usage) 

sys.exit(O) 
server = arguments [0] 
user = arguments[l] 
password = arguments [2] 
for mail_info in get_mai Is (server, user, password): 

print(mail_info) 

if name == ' main ' : 

parser = OptionParserO 

parser. usage = 'usage: server user pass' 

for option in options: 

param = option['noms '] 

del option['noms'] 

parse r.add_opti on (■• param, ••■•option) 

options, arguments = parser. parse_args() 
sys.argv[:] = arguments 
main(options , arguments, parser) 

Discussion 

A chaque connexion, le systeme liste les messages marques non lus du serveur, dans 
l'ordre chronologique inverse. 

L'affichage du sujet et de l'expediteur necessitent un traitement prealable car les 
en-tetes peuvent etre encodes, lorsque les donnees contiennent par exemple des 
accents. C'estle role de decode_header. 
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yield est utilise pour demander un a un les e-mails au serveur IMAR De cette 
maniere, l'affichage du premier e-mail est instantane et seuls les e-mails affiches sont 
consommes dans la boucle. Ainsi, si l'argument num_di splay (par defaut a 5) est 
augmente, et si le programme offre a l'utilisateur une option pour afficher les e-mails 
en mode pas-a-pas et arreter le processus, le nombre de messages n'aura pas d'impact 
sur les performances de la fonction getjnai 1 s. 

Extension 

Ce systeme de prelecture peut etre couple a un systeme local de filtres, en charge de 
deplacer sur le serveur les messages dans des sous-dossiers en fonction de regies sur le 
contenu du message. 



Divers 

Cette serie d'exercices s'acheve par la section Divers, qui contient un exercice de 
creation d'un systeme de documentation en ligne, capable d'introspecter le code des 
modules pour afficher l'aide d'une classe ou d'une fonction. 

Exercice 14 : systeme de documentation en ligne des modules 
Description 

L'objectif de l'exercice 14 est de fournir un outil d'affichage des docst rings des 
fonctions et classes contenus dans un module python, dans l'esprit du module pydoc. 

Points abordes 

Paquet compiler. 

Solution 

Doc en ligne 

#!/usr/bin/python 
# -*- coding: utf8 -*- 
import os. path 
import sys 

from compiler import parse 
from compiler import walk 
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from compiler. visitor import ASTVisitor 

from compiler. ast import Stmt, Class, Function 

class DisplayVisitor(ASTVisitor) : 

"""Visite VAST 

def init (self, name): 

self. name = name 

def _visit_node(self , node): 

"""Appelle sur les nodes""" 
if (isinstance(node, Stmt) or 

(hasattr(node, 'name') and node. name != self. name)): 
for subnode in node.getChildNodes() : 

self ._visit_node(subnode) 
return 

if not (isinstance(node, Class) or isinstance(node, Function)): 
return 

print('Trouve ligne %d' % node.lineno) 
if node. doc is None: 

print('\n\tAucun docstring\n ') 
else: 

print ('\n\t%s\n' % node. doc) 

visitClass = _visit_node 
visitFunction = _visit_node 
visitStmt = _visit_node 

def print_module(path , element, verbose=False) : 

"""Permet l'affichage d'un doctstring de classe ou de fonction""" 
with open(path) as f: 

ast = parse(f . read()) 

wal k(ast , DisplayVi si tor (element)) 

if name == ' main ': 

print_module(sys.argv[l] , sys.argv[2]) 

Discussion 

Grace a sa fonction parse, le paquet compiler construit un AST {Abstract Syntax 
Tree) a partir de code Python. Tres rapide, cette operation lit le contenu d'un module 
sans avoir a l'importer. 

wal k offre ensuite la possibilite de traverser l'AST, en fournissant une classe qui derive de 
la classe compi 1 er . vi si tor . ASTVi si tor. Chaque nceud de l'AST est passe a la methode 
vi si tTypeNoeud de la classe si elle existe, ou TypeNoeud est le type de noeud visite. 
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Extension 

En partant de ce mecanisme d'introspection, il est possible de concevoir un outil de 
recherche rapide equivalent a grep, mais oriente pour le code Python. 



En un mot... 

Cette serie d'exercices a permis d'apprehender Python dans des exemples plus con- 
crets et complets que les simples extraits de code des chapitres precedents. 

L'objectif etait de restreindre l'integralite des exercices a la bibliotheque standard pour 
montrer son aspect batteries included. Evidemment, il existe des bibliotheques tierces 
qui offrent parfois des fonctionnalites plus poussees ou des solutions plus elegantes 
pour resoudre certains problemes. Nous en presentons certaines a la fin de ce livre. 

Soulignons enfin que les exercices ont ete concus par le biais de la programmation 
dirigee par les tests, qui est presentee au chapitre suivant. 



QUATRIEME PARTI E 



Techniques 
avancees 



C'est officiel, a ce stade du livre, les lecteurs assidus sont devenus des developpeurs 
Python chevronnes, capables d'ecrire en quelques lignes des fonctionnalites simples 
et puissantes. 

Cependant, des que les programmes grossissent, un nouvel enjeu apparait : le 
besoin d'efficacite dans les methodes de programmation pour ne pas se faire 
deborder par le code. 

Un developpeur efficace sait : 

• livrer des programmes fiables, meme lorsqu'ils deviennent consequents ; 

• resoudre les problematiques de performance ; 

• gerer l'organisation du code et rendre le programme modulaire. 

Cette derniere partie regroupe trois chapitres dedies a des techniques avancees de 
programmation, qui permettent de gerer ces problematiques, a savoir : 

• la programmation dirigee par les tests ; 

• les bonne pratiques ; 

• la programmation orientee objet. 
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Programmation 
dirigee par les tests 



No tests, no commit 
« Code non teste, code invalide » 



Python est un langage de programmation agile, propice a la mise en oeuvre de 
methodes de developpement reactives, comme la programmation dirigee par les 
tests. Cette methode eprouvee permet d'ameliorer de maniere drastique la qualite du 
code et l'agilite avec laquelle les developpeurs peuvent le modifier, et est tres facile a 
mettre en oeuvre en Python. 

Culturellement, Guido van Rossum et toutes les personnes qui ont participe a la 
creation du langage sont tous des convaincus de cette technique et les outils qui sont 
presentes dans ce chapitre existent depuis toujours dans Python. Ce chapitre pre- 
sente ces outils, apres avoir defini les principes des tests et surtout leve la barriere cul- 
turelle que notre cerveau dresse naturellement lorsque Ton decouvre pour la premiere 
fois cette technique. 
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A quoi servent les tests ? 



Dans le cycle de creation d'un logiciel, il arrive inevitablement qu'un programmeur 
teste le code qu'il a ecrit, pour verifier qu'il se comporte comme prevu. Ces tests sont 
preferablement effectues avant de livrer le logiciel ou la fonctionnalite, et font partie 
integrante du travail de developpement. 

Tester un logiciel comme le ferait le client, pour valider point par point que tout 
fonctionne peut devenir relativement fastidieux, car il faut en toute logique recom- 
mencer a chaque insertion ou modification de code. 

La premiere idee de la programmation dirigee par les tests est done d'ecrire des 
scripts de tests pour automatiser cette tache. 

La deuxieme idee qui en decoule est de se premunir de toute regression. La regres- 
sion est le fait d'introduire ou de modifier du code pour ajouter une fonctionnalite A 
et de provoquer indirectement un dysfonctionnement dans une fonctionnalite B qui 
se comportait jusqu'alors tres bien : si la batterie de tests contient un test qui verifie la 
fonctionnalite B et si les tests sont relances au moment de l'introduction de A, le 
probleme sera alors tout de suite decele. 

Ce principe est d'autant plus important que le logiciel grossit : il est de plus en plus 
difficile pour un developpeur d'avoir une vision globale au moment de l'introduction 
d'une nouvelle fonctionnalite, pour eviter ces effets de bords. 

La programmation dirigee par les tests consiste a ecrire des scripts de tests en paral- 
lele et au meme moment que le code, pour chaque nouvelle fonctionnalite introduite 
dans le programme. 

Enfin, Taction meme d'ecrire un test au moment de la conception d'une fonctionna- 
lite augmente de maniere considerable la qualite du code : reflechir a un test valide la 
pertinence des parametres d'entree, de sortie et le fonctionnement logique du code et 
force a une relecture avec plus de recul. Le nombre de bogues ou de defauts de con- 
ception est divise par cinq par cette action. En outre, ces tests constituent la 
meilleure documentation possible pour le code. 



Barriere culturelle 

« Ecrire un test a chaque nouvelle fonction ?Je n'aipas le temps ! » 

Le seul frein reel a ce type d'approche est culturel : il est tres difficile pour un deve- 
loppeur et/ou son chef de projet d'admettre que 60 % du temps de developpement 
est voue habituellement a deboguer du code ecrit. II est meme frequent, pour ne pas 
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dire systematique, que le temps prevu au debogage soit bien en-dessous de la realite 
dans la planification d'un projet. 

Les developpeurs sceptiques deviennent en general adeptes le jour ou ils sont charges 
d'introduire ou modifier une fonctionnalite de bas niveau dans un gros logiciel en 
production : les tests deviennent dans ce cas pour le developpeur ce que le filet de 
securite est au trapeziste. 

Les chefs de projet qui emettent des reserves le font car il est tees difficile de quantifier 
les gains de temps obtenus par ce genre d'approche : ils dependent fortement de la per- 
sonnalite de chaque composante de l'equipe, du type de projet, et des situations. 



En SAVOIR PLUS La gestion de projet, extreme Programming 

La lecture de Gestion de projet - extreme Programming, par Bernard, Bossavit, Medina et Williams chez 
le meme editeur, donnera plus d'informations sur ce sujet au lecteur interesse. 



Principes 



Les eXtremistes (adeptes de 1'eXtreme Programming) preconisent d'ecrire les tests 
avant le code, pour former une sorte de mini-cahier des charges pour le developpe- 
ment. Le code peut ensuite etre bati pour faire fonctionner chacun des tests. S'ensuit 
un cycle iteratif pour faire grossir tour apres tour tests et code. 

Cette approche est la plus pure mais dans la realite les developpeurs alternent en general 
l'ordre de conception (code puis test ou test puis code) en fonction des situations. 

Lessentiel reste d'alterner chacun des deux exercices : le plus dur en general pour un 
developpeur est de reussir a s'arreter de coder pour passer cote tests. 

On peut separer les tests en deux categories complementaires : 

• les tests unitaires ; 

• les tests fonctionnels. 



Tests unitaires 



Les tests unitaires testent de maniere isolee les fonctionnalites d'un module ou pac- 
kage, sans se soucier du reste du logiciel, pour verifier qu'ils repondent bien aux cas 
d'utilisation {use cases). 



Techniques avancees 

QUATRIEME PARTIE 



Construction d'un test unitaire 

Prenons l'exemple d'une fonction en charge de calculer une moyenne. 

Cette fonction prend en parametre un nombre indefini de valeurs entieres et renvoie 
la moyenne, basee sur une division entiere. 

Les premiers tests qui peuvent etre effectues sur cette fonction sont de valider quelle ren- 
voie bien les resultats attendus, en proposant quelques cas basiques qui viennent a l'esprit. 

Ecrivons ces tests dans un fichier Python, avec la directive assert (), qui leve une 
exception si l'assertion passee en parametre est fausse. 

Use cases pour la nouvelle fonction 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

# cas simples 

assert moyenne(5) == 5 

assert moyenne(5, 8, 9) == 7 

assert moyenne(5, 8, 9, 78, 43) == 28 

Ces tests echoueront bien sur des la premiere ligne car la fonction n'existe pas encore, 
mais guident le developpeur pour la conception. 

Premiere implementation 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

def moyenne(*nombres) : 
taille = len(nombres) 
somme = 
for nombre in nombres: 

somme += nombre 
return somme / taille 

# cas simples 

assert moyenne(5) == 5 

assert moyenne(5, 8, 9) == 7 

assert moyenne(5, 8, 9, 78, 43) == 28 

Cette premiere version remplit plutot bien ses objectifs puisqu'elle valide les trois cas 
proposes. 
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Evolution des use cases 

Lorsqu'un nouveau bogue ou un fonctionnement non souhaite est decouvert, le che- 
minement qui l'a provoque devient un nouveau use case et le test unitaire correspon- 
dant doit etre modifie pour en tenir compte. 

L'ajout de ce nouveau cas doit faire echouer le test sur l'ancien code. Ce nest qu'apres 
avoir valide que le test provoquait bien le probleme a corriger que le code est modifie. 

Pour notre fonction de moyenne, un cas special a ete rapporte par un utilisateur : si 
aucun parametre nest fourni, une erreur de division par zero est provoquee. L'utilisa- 
teur souhaite que la fonction renvoie None dans ce cas. 

Un nouveau test correspondant a ce use case est ajoute. 
Ajout d'un use case 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

def moyenne(*nombres) : 
taille = len(nombres) 
somme = 
for nombre in nombres: 

somme += nombre 
return somme / taille 

# cas simples 

assert moyenne(5) == 5 

assert moyenne(5, 8, 9) == 7 

assert moyenne(5, 8, 9, 78, 43) == 28 

# aucun parametre en entree 
assert moyenne() == None 

Le developpeur valide dans un premier temps que ce test provoque bien l'erreur indi- 
quee... 

Test de la division par zero 

[tziade@Tarek Desktop] $ python tests_unitai res. py 
Traceback (most recent call last): 

File "tests_unitai res.py" , line 15, in ? 

assert(moyenne() == None) 
File "tests_unitai res.py" , line 9, in moyenne 
return somme / taille 
ZeroDivisionError: integer division or modulo by zero 

... puis corrige son implementation pour que le test passe. 
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Seconde version 

#!/usr/b"in/python 

# -*- coding: utf8 -*- 

def moyenne(*nombres) : 
taille = len(nombres) 
if taille == 0: 
return None 
somme = 
for nombre in nombres: 

somme += nombre 
return somme / taille 



# cas simples 
assert moyenne(5) 
assert moyenne(5, 
assert moyenne(5, 



5 

9) == 7 

9, 78, 43) 



28 



# aucun parametre en entree 
assert moyenneQ == None 



Non-regression 

L'accumulation de tests au fur et a mesure de revolution du code permet d'assurer la 
non-regression de ce dernier. Si tous les tests sont bien rejoues a chaque modifica- 
tion, la nouvelle version du code est assuree de continuer a faire fonctionner tous les 
use cases precedents. 

Toujours sur notre exemple de moyenne, notre utilisateur a remarque que la fonction 
levait bien une erreur de type Type Error lorsque l'un des parametres n'etait pas un 
entier, mais sans specifier lequel. II souhaiterait que le message d'erreur soit plus 
explicite, en indiquant le parametre qui pose probleme. 

Un test est ajoute pour proposer un message d'erreur plus explicite. 
Message TypeError explicite 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

def moyenne(*nombres) : 
taille = 1 en (nombres) 
if taille == 0: 

return None 
somme = 
for nombre in nombres: 

somme += nombre 
return somme / taille 
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# cas simples 

assert moyenne(5) == 5 

assert moyenne(5, 8, 9) == 7 

assert moyenne(5, 8, 9, 78, 43) == 28 

# aucun parametre en entree 
assert moyenneO == None 

# message d'erreur de type plus explicite 
try: 

moyenne(5 , ' u' , 8) 
except TypeError, e: 

assert str(e) == "'u' n'est pas un entier" 

Le developpeur modifie ensuite la fonction pour gerer ce nouveau cas. 

Troisieme version 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

def moyenne('-'nombres) : 

taille = len(nombres) 
if taille == 0: 
return None 
somme = 
for nombre in nombres: 

if not isinstance(nombre, int): 

raise TypeError(" '%s' n'est pas un entier" % str(nombre)) 
somme += nombre 
return somme / taille 

# cas simples 

assert moyenne(5) == 5 

assert moyenne(5, 8, 9) == 7 

assert moyenne(5, 8, 9, 78, 43) == 28 

# aucun parametre en entree 
assert moyenneO == None 

# message d'erreur de type plus explicite 
try: 

moyenne(5 , ' u' , 8) 
except TypeError, e: 

assert str(e) == "'u' n'est pas un entier" 

Si la batterie de tests est a nouveau executee pour valider la modification, le premier 
test ne fonctionne plus. 
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Regression 

[tziade@Tarek Desktop]! python tests_unitai res.py 
Traceback (most recent call last): 

File "tests_unitai res .py" , line 16, in ? 
assert moyenne(5) == 5 
AssertionError 

La modification, qui estvalide pour le nouveau use case, a ajoute un bogue qui a pro- 
voque une regression sur un autre use case, decelee par le test unitaire. 

Dans notre cas, il s'agit d'une erreur d'indentation classique : la ligne somme += 
nombre qui suit le rai se a ete indentee par megarde. 

Troisieme version corrigee 

def moyenne(*nombres) : 
taille = len(nombres) 
if taille == 0: 

return None 
somme = 
for nombre in nombres: 

if not isinstance(nombre, int): 

raise TypeError(" '%s ' n'est pas un entier" % str(nombre)) 

somme += nombre 
return somme / taille 

Regroupement des tests 

En termes de decoupage, on associe generalement un ensemble de tests par module 
de code Python. Ce precede permet de valider que les differentes classes, constantes 
et fonctions regroupees dans un meme module representent une brique logique du 
programme : si les elements regroupes ne se testent pas de maniere simple et homo- 
gene dans l'ensemble de tests, il y a fort a parier que leur regroupement n'est pas bon. 

En reprenant i'exemple precedent, si la fonction moyenne() fait partie d'un module 
uti 1 s . py, on peut regrouper le code de test dans un module test_uti 1 s . py. 

Tests plus complexes : raconter une histoire 

Pour des tests plus longs qu'un simple appel a une fonction, la methode la plus simple 
consiste a raconter des petites histoires, qui correspondent a des scenarii d'utilisation. 
Ces histoires sont des melanges de commentaires, lignes de code et assertions. 

L'exemple ci-contre est un test possible pour le module cPi ckl e. 
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Scenario de test de cPickle 

#!/usr/bin/python 

# -*- coding: ISO-8859-15 -*- 
import cPickle 

# une classe basique pour nos tests 
class T: 

a = 
b = 

# voici un objet a sauvegarder 
o = T() 

o.a = 1 
o.b = 2 

# creons un fichier en ecriture 

fie = open ('/home/tziade/pi ckled.bin' , 'w') 

# ecrivons 1 'objet o dans le flux avec la methode dump de cPickle 
cPickle. dump (o, fie) 

# fermons le fichier 
fic.closeO 

# ouvrons le fichier en lecture 

fie = open('/home/tziade/pickled.bin') 

# cPickle. load permet de recharger un objet apres une sauvegarde par 
dump 

o2 = cPickle. load (fie) 

# verifions 1 'objet renvoye 
assert(isinstance(o2 , object)) 
assert(o2 .a == 1) 
assert(o2 .b == 2) 

Les tests ecrits de cette maniere constituent aussi une documentation pour le module 
teste. 

Les bouchons 

Idealement, un module de test ne doit concerner que le module teste et doit pouvoir 
s'executer sans dependre d'une ressource externe qui n'est pas forcement presente sur 
la machine de tests. 

Les dependances de ce genre, frequentes dans les applications web ou de gestion, 
peuvent etre evitees grace a la technique du bouchon. 
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Cette technique consiste a modifier a la volee, au moment du test, la portion de code 
qui accede a une ressource externe pour la remplacer par du code qui se contente de 
renvoyer un resultat convenable pour la suite des tests. L'objectif est de faire croire au 
code appelant que tout s'est bien deroule, et de lui renvoyer un resultat correct. La 
qualite d'imitation du resultat renvoye depend de 1'utilisation qui en est faite dans le 
code et peut parfois etre grossiere. 

Python est un langage suffisamment souple pour permettre de modifier les defini- 
tions de modules, classes et fonctions a la volee, et cette technique peut etre appli- 
quee a tous les etages du code. 

Modification de fonctions et methodes 

L'exemple ci-dessous modifie temporairement la fonction urlopen d'ur~l"lib2 avant 
de demarrer les tests, pour quelle renvoie un resultat meme si la machine de test ne 
peut pas se connecter a FURL indiquee. 

Bouchon pour urllib 

#!/usr/bin/python 

# -*- coding: utf8 -*- 
import urllib 

import StringlO 

# fonction de remplacement 
def fakeopen(url , data=None) : 

res = StringlO. StringIO('<htmlxbody>Dummy Page</bodyx/html>') 
return res 

# monkey patching 
original_urllib = urllib. urlopen 
urllib. urlopen = fakeopen 

# test d'exemple 

res = urllib. urlopen('http://google.f r ') 
assert (res . readlines() , 

[ ' <html ><body>Dummy Page</bodyx/html > ' ] ) 



# retrait du patch 

urllib. urlopen = original_urllib 

Le test d'exemple ne sert qua valider que le patch a bien ete applique. Dans cette 
zone, tout acces a la fonction urlopen, executera le patch, sauf si la directive reload 
est appelee sur le module unittest. 
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Le code contenu dans le patch peut ensuite etre modifie, voire varier en fonction des 
appels, afin de flouer tout code appelant. 

Modification de classes 

II est parfois necessaire de modifier une classe entiere. C'est le cas par exemple de la 
quasi-totalite des classes qui implementent des clients reseaux. Si Ton teste une 
application qui est en charge d'envoyer des e-mails, il est necessaire de creer une 
fausse classe smtpl i b . SMTP complete, appeleefake pour simuler l'envoi des e-mails. 

La construction d'un fake doit se faire de maniere iterative, afin de ne coder que ce 
qui est vraiment necessaire a la simulation. La premiere etape consiste a creer une 
classe totalement vide et un test qui envoie un e-mail. Au moment de la relance des 
tests, l'interpreteur affichera toutes les erreurs dues a la non-disponibilite de la res- 
source reseau, a savoir le serveur SMTP. 

Le fake pourra alors etre complete en fonction des erreurs, au fur et a mesure des 
essais, jusqu'a ce que la simulation fonctionne. 

Version 1 

#!/usr/bin/python 

# -*- coding: utf8 -*- 
import smtplib 

class FakeSMTP: 
pass 

# mise en place du bouchon 
original_SMTP = smtplib. SMTP 
smtplib. SMTP = FakeSMTP 

# sequence classique d'appel a SMTP 
sender = smtplib. SMTP('mon. serveur .smtp') 
message = 'mon message bidon' 

destinatai res = ['alfred@mlksnc.com', 'marie@zertceo.com'] 
sender .sendmail ('bill@hou .com' , destinatai res, message) 
sender .quit() 

# retrait du patch 
smtplib. SMTP = original_SMTP 

L execution de ce code provoque une erreur de constructeur. 



Techniques avancees 

QUATRIEME PARTIE 



Erreur version 1 

[tziade@Tarek Desktop]! python test_imap"lib.py 
Traceback (most recent call last): 

File "test_"imaplib.py" , line 13, in ? 

sender = smtplib.SMTP('mon.serveur .smtp') 
TypeError: this constructor takes no arguments 

II est necessaire de rajouter un constructeur a notre fake, le plus large possible, pour 
couvrir tout type d'initialisation. Reprendre comme modele le constructeur de la 
classe reelle est le choix le plus precis, mais un modele generique suffit amplement. 

Version 2 



class FakeSMTP: 

def init (*args, 

pass 



v *kw) : 



L execution repousse l'erreur un peu plus loin dans la mecanique d'envoi d'e-mails. 
Test version 2 

[tziade@Tarek Desktop]! python test_imaplib.py 
Traceback (most recent call last): 

File "test_imaplib.py" , line 17, in ? 

sender .sendmail ('bill@hou .com' , destinatai res, message) 
AttributeError: FakeSMTP instance has no attribute 'sendmail' 

La fonction sendmai 1 () n'a pas besoin de renvoyer de resultat, sa simulation est done 
aussi simple que le constructeur. Meme observation pour quit(). 

Version 3 

class FakeSMTP: 

def init (*args, **kw): 

pass 

def sendmail (*args, **kw) : 
pass 

def quit(self) : 
pass 



Le test est a present valide et le fake fonctionnel pour l'envoi d'e-mails. 
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Dans l'exemple, le protocole d'envoi d'un e-mail est connu et a ete mis dans le test du 
patch, mais le principe de construction par essai-erreur peut s'appliquer en aveugle 
pour des objets non connus, en appelant directement le code client dans le test. 

Simulation d'un module complet 

II est parfois necessaire de simuler un module complet pour couper toute dependance 
a des bibliotheques liees par des directives import. L'interpreteur gere un diction- 
naire ou il conserve tous les modules importes. A chaque nouvelle importation, ce 
dictionnaire est controle et si le nom (sans chemin) du module apparait dans la liste 
des cles, l'objet de type module n'est pas recree. 

Remplacer un module par un autre module reserve aux tests consiste done a sup- 
primer l'entree de ce module dans le dictionnaire et a en recreer une avec le module 
de remplacement. 

II est fortement deconseille d'utiliser le meme nom que le module original : dans cer- 
tains cas le patch peut s'activer lorsque ce n'est pas souhaite. Cette situation peut se 
produire lorsque le code appelant rencontre le module de patch avant le module reel, 
par le jeu des chemins de recherche. 

Un nom prefixe par f ake_ par exemple, est plus explicite. 

Exemple de patch pour le module i map! i b : 

Bouchon (fakeimaplib.py) 

** Bouchon IMAP ** 

class IMAP4: 

def "login(sef, user, password): 
return True 

Unite de test 

#!/usr/bin/python 

# -*- coding: ISO-8859-15 -*- 
import sys 

# dechargement du vrai module imap si necessaire 
if 'imaplib' in sys. modules. keys() : 

original_imap = sys.modules[' imaplib' ] 
del sys. modules ['imaplib'] 
else: 

original_imap = None 
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# chargement du fake 

import fakeimaplib as imaplib 

sys.modules[' imaplib'] = sys.modules[' fakeimaplib'] 

# utilisation du fake 
print imaplib. doc 

# dechargement du fake 
del sys .modules [ 'imaplib'] 

# rechargement du vrai module imap si necessai re 
if original_imap isnot None: 

sys .modules[ 'imaplib'] = original_imap 



A RETENIR Primitive reloadQ et objet module 

• La primitive reload () permet de forcer le rechargement d'un module. Si elle est appelee pendant 
les tests, le patch saute. 

• L'objet module peut etre remplace par n'importe quel type d'objet, du moment qu'il couvre les 
appels qui lui sont faits. 



Test coverage 

Lorsque la batterie de tests est executee, le ratio entre le nombre de lignes parcourues 
et le nombre de lignes totales du programme, appele test coverage, doit etre dans 
l'ideal egal a 1. Si ce ratio est inferieur, cela signifie que certaines lignes de 1' applica- 
tion ne sont jamais testees. 

Deux actions sont possibles : 

• Les tests sont completes pour couvrir les cas non explores. 

• Les lignes de code en question sont retirees car mortes. Les lignes mortes sont des 
residus de code qui ne peuvent jamais etre appeles. 

Qualite des tests 

Le facteur cle de reussite de ce type de programmation tient dans la pertinence des 
tests ecrits. Mai employee, la technique peut s'averer beaucoup moins efficace. 

Void quelques conseils pratiques : 

• N'inventez pas de use cases dans les tests, seuls ceux definis dans les specifications 
importent. 

• Chaque test doit raconter une petite histoire, du debut jusqu'a la fin. Si l'histoire 
s'interrompt, le decoupage des tests est mauvais. 
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• Rythmez continuellement les sequences de test et de codage, ne reportez jamais 
l'ecriture de certains tests a plus tard si vous etes cote code. 

• Pour un refactoring, c'est-a-dire une modification en profondeur d'un code exis- 
tant, essayez de segmenter au maximum le travail de reecriture pour pouvoir 
relancer la batterie de tests complete regulierement et modifier si necessaire cer- 
tains tests. 

Un developpeur qui debute dans cette technique derape facilement vers des tests trop 
longs ou incomplets. La pertinence des tests s'acquiert par experience et gout. 



Tests fonctionnels 



Les tests fonctionnels ont le meme objectif que les tests unitaires, mais imitent un 
utilisateur qui se sert de l'applicatif. 

Lobjectif nest plus dans ce cas de couvrir systematiquement chaque ajout de code, 
mais plutot de valider globalement que les fonctionnalites demandees sont bien cou- 
vertes par le logiciel. 

Ces tests peuvent etre utilises au moment de la recette pour verifier avec le client que 
le produit livre correspond bien a ses attentes. lis deviennent une sorte de checklist, 
ou chaque point du cahier des charges est verifie. 

Dans certains cas, et si les outils le permettent, ces tests peuvent meme etre concus 
par le client lui-meme. 

Ces tests constituent un excellent outil commercial pour prouver la qualite du code 
au client. lis permettent aussi la prevention de regressions qui apparaissent au cours 
de revolution du developpement d'une application. 

La question a se poser est done : 

« Que m'apportent de plus les tests fonctionnels que les tests unitaires a moi, 
developpeur ? » 

Tests de I'interface 

Les tests fonctionnels doivent operer sur le logiciel de la meme maniere qu'un utilisa- 
teur. lis doivent done utiliser I'interface du logiciel. 

Dans le cas de programmes utilises en ligne de commande, I'interface entre le pro- 
gramme et l'utilisateur est tres etroite, et les tests fonctionnels s'apparentent plus a 
des tests d'integration en mode boite noire : on verifie que les differents composants 
de l'application fonctionnent correctement pour un ensemble de parametres d'entree 
qui correspondent aux differents scenarii d'utilisation. 
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Pour tous les programmes a interface graphique, les tests fonctionnels permettent de 
valider des portions de code de tres haut niveau concernant la mecanique d'affichage, 
qui ne sont pas toujours couvertes par les tests unitaires, et d'emprunter les memes 
chemins que l'utilisateur, pour couvrir des combinaisons qui ne se retrouvent pas for- 
cement dans les tests unitaires. 

Enfin, pour les applications web, les tests fonctionnels qui ne travaillent que par 
l'intermediaire des pages web calculees puis envoyees au navigateur, permettent de 
verifier, dans les limites des outils disponibles, le bon rendu des pages. 

Tests de I'ergonomie 

Lorsqu'une application graphique est manipulee par un utilisateur, il est guide par la 
logique de presentation des informations. Les tests fonctionnels suivent les memes rails. 

Pour chaque fonctionnalite complexe du logiciel, qui necessite des enchainements 
d'ecrans, des saisies de donnees, etc., la conception d'un test fonctionnel peut per- 
mettre de deceler un certain nombre de problematiques d'ergonomie, comme : 

• des enchainements d'ecrans incomprehensibles ; 

• un chemin trop long, pouvant etre raccourci ; 

• un dose d'informations par ecran trop pauvre ou trop riche, etc. 

Dependence forte a I'outil utilise et au type d'interface 

Contrairement aux tests unitaires, les tests fonctionnels sont fortement dependants de 
I'outil utilise. Pour les interfaces graphiques, les developpeurs utilisent frequemment 
des logiciels tiers, qui implementent leurs propres mecanismes de scripts et parfois ne 
proposent que d'enregistrer les actions souris pour les rejouer sur l'applicatif 

La suite de ce chapitre ne portera done que sur les outils et techniques relatives aux 
tests unitaires, applicables dans tout contexte. 

On peut citer, pour le lecteur interesse, certains outils libres pour les tests fonction- 
nels, qui s'adaptent bien a un environnement Python : 

• Les projets mechanize (http://wwwsearch.sourceforge.net/mechanize/) et WebUnit 
(http://webunit.sourceforge.net/) fournissent des objets Python sans interface gra- 
phique qui simulent le comportement d'un navigateur web avec gestion des for- 
mulaires, des cookies, des redirections... 

• Le logiciel Selenium (http://selenium.thoughtworks.com/) permet de jouer des sce- 
narii programmes dans un veritable navigateur web tel qu'Internet Explorer ou 
Mozilla Firefox. 

• Le logiciel FunkLoad (http://funkload.nuxeo.org/) offre un systeme de benchmark 
et de reporting etendu. 
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Outils 



Python fournit dans la bibliotheque standard un framework de tests pour faciliter 
l'ecriture et l'utilisation des tests unitaires. Comme pour la plupart des langages 
actuels, ce framework est inspire des travaux de Kent Beck, qui a concu un premier 
outil sous Smalltalk, porte par la suite sous Java, sous le nom de JUnit. 

La version Python, PyUnit, offre les fonctionnalites standards d'un outil de test, a 
savoir : 

• preparation d'un contexte d'execution particulier pour une serie de tests, appele 
test fixture. 

• creation de series de tests, comprenant un test fixture et des tests : les test cases. 

• creation de collections de test cases, les test suites. 

• lancement des test suites et affichage des resultats, par le test runner. 

Cette implementation est faite dans le module unittest de Python. 

Certains puristes trouvent que cette implementation n'est pas tres pythonique, car les 
API sont calquees sur l'outil Java, mais elle s'avere tres souple a l'usage et a le merite 
de faciliter 1'utilisation des tests unitaires aux developpeurs venant d'autres langages. 

Un deuxieme outil plus original et plus specifique a Python permet d'inserer des tests 
directement dans le code source. Ces tests, inseres dans les commentaires, sont col- 
lectes par l'outil et executes. Ce mode de fonctionnement permet d'illustrer in situ le 
code avec des exemples d'utilisation. 

Enfin, un outil supplemental, non present dans la bibliotheque standard, permet 
de scanner le code pour reperer les lignes qui ne sont pas couvertes par les tests. 



unittest 



Le module unittest fournit toutes les composantes necessaires a la creation des 
tests, a savoir : 

• des classes pour la definition des test cases ; 

• une classe pour la collecte des resultats ; 

• une classe pour definir des test suites ; 

• des utilitaires de lancement des tests. 

En utilisation classique, les seules etapes necessaires a l'utilisation d'unittest sont : 

• la definition des tests cases ; 

• l'organisation et l'utilisation des modules de tests. 
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Definition des test cases 

Le module unittest fournit deux classes pour definir des test cases : 

• TestCase : classe de base servant de socle pour toute classe implementant des 
tests. 

• FunctionTestCase : classe derivee de TestCase qui permet d'encapsuler une 
fonction de test existante pour la rendre compatible avec le framework PyUnit. 

La classe TestCase 

Ces classes de definitions sont utilisees par le framework, par le biais d'un certain 
nombre de methodes : 

• setUpO : appelee avant l'execution de chaque methode de test, elle sert a initiali- 
ser le contexte d'execution du test suivant. Cette methode peut etre surchargee 
par les classes derivees pour definir le test fixture. Ne fait rien par defaut. 

• run ([result]) : lance la batterie de tests de la classe, en collectant toutes les 
methodes de la classe dont le suffixe est « test » et en les executant dans l'ordre 
trouve. Si result est fourni, il doit etre un objet de type TestResult et est rempli 
avec les resultats des tests. Si resul t est omis ou a None, les resultats sont collectes 
dans un objet interne a la methode mais ne seront pas renvoyes. 

• Debug () : execute les methodes de test de la classe sans collecter les resultats. Ces 
appels se font directement, ce qui permet de recuperer d'eventuelles erreurs. 

• TearDownO : appelee apres l'execution de chaque methode de test (reussie ou 
non). Permet d'effectuer d'eventuels nettoyages (fermeture de connexion reseau, 
de fichier, etc.). Cette methode est appelee uniquement en cas de succes de 
setUpO . Cette methode ne fait rien par defaut et peut etre surchargee dans les 
classes derivees. 

Pour adapter TestCase, il suffit de creer une nouvelle classe derivee, d'y ajouter des 
methodes de test et si besoin d'y implementer setUpO et tearDown(). 

Module de test 

Chaque classe de test est ecrite dans un module Python dedie, portant le nom du 
module teste, prefixe de test_ ou test. 

Si Ton utilise cette structure pour le test precedent du module cPi ckl e, on obtient le 
module test_cPi ckl e . py ci-contre. 
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test_cPickle.py 

#!/usr/bin/python 

# -*- coding: utf8 -*- 
import cPickle 
import unittest 

# une classe basique pour nos tests 
class T: 

a = 
b = 

class cPickleTestCase(unittest.TestCase) : 

def _genere_instance(self) : 
""" renvoi un objet """ 
o = T() 
o.a = 1 
o.b = 2 
return o 

def test_dump_et_load(self) : 

test l'E/S de cPickle 

# objet de test 

o = self ._genere_instance() 

# creons un fichier en ecriture 

fichier = open ('/home/tziade/pi ckled.bin' , 'w') 

# ecrivons 1 'objet o dans le flux avec la methode dump de cPickle 
cPickle.dump(o, fichier) 

# fermons le fichier 
fichier. close() 

# ouvrons le fichier en lecture 

fichier = open('/home/tziade/pickled.bin') 

# cPickle. load permet de recharger un objet apres une sauvegarde 
par dump 

o2 = cPickle. load (fie) 

# verifions 1 'objet renvoye 
assert(isinstance(o2 , object)) 
assert(o2.a == 1) 
assert(o2.b == 2) 

Tout nouveau scenario de test pour cPickle pourra etre implemente dans une nou- 
velle methode de cette classe, en prefixant son nom par « test ». 



Techniques avancees 

QUATRIEME PARTIE 

Methodes d'assertion de TestCase 

Dans le code de test, la directive assert O qui permet de valider un resultat, leve en cas 
de probleme une erreur de type Asserti onError, qui est interceptee par le framework. 

Cette erreur n'apporte pas explicitement d'explications sur le probleme rencontre et 
necessite de toujours fournir une expression qui renvoie une valeur booleenne. 

TestCase fournit une batterie de methodes d'assertions qui couvrent tous les types de 
tests et clarifient le code, par leurs noms explicites. Chacune de ces methodes fournit 
un message d'erreur standard pour le test effectue : 

• assert_(expr, msg=None) : equivalente a la directive assert (). Leve une excep- 
tion si l'expression fournie ne vaut pas True. Si msg est fourni, il est associe a 
l'exception. Synonymes : assertTrue, fail Unless. 

• assertFalse(expr, msg=None) : similaire a assert_() mais teste si l'expression 
renvoie False. Synonyme : fail If. 

• assertRaises(excClass, callableObj, *args, **kwargs) : permet de valider 
que l'objet cal 1 abl eOb j leve bien une erreur de type excCl ass lorsqu'il est appele 
par un appel excClass(*args, **kwargs). args et kwargs etant optionnels. 
Synonyme: failUnlessRaises. 

• assertAlmostEqual (fi rst , second, places=7, msg=None) : permet de tester 
que round(second-fi rst, places) renvoie 0. places determine done la puis- 
sance de l'arrondi applique au moment de la comparaison. Cette methode est 
utile pour les tests manipulant des objets de type f 1 oat. Si msg est fourni il est 
associe a l'exception. Un message par defaut est utilise dans le cas contraire. 
Synonymes : assertAlmostEquals, failUnlessAlmostEqual. 

• assertNotAlmostEqual (fi rst , second, places=7, msg=None) : equivalente a la 
methode precedente mais teste que round(second-fi rst, places) ne renvoie 
pas 0. Si msg est fourni il est associe a l'exception. Un message par defaut est utilise 
dans le cas contraire. Synonymes : assertNotAlmostEqual s, faillfAlmostEqual . 

• assertEqual (fi rst , second, msg=None) : teste que fi rst est egal a second. Si 
msg est fourni il est associe a l'exception. Un message par defaut est utilise dans le 
cas contraire. Synonymes : assertEqual s, failUnlessEqual 

• assertNotEqual : equivalente a la methode precedente, mais teste l'inegalite. 
Synonymes : assertNotEqual s, fail If Equal . 

On peut done remplacer les trois assertions par le code suivant. 
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Utilisation des methodes d'assertion 

# verifions 1'objet renvoye 

self .assert_(i sin stance (o2 , object) , 

"1'objet renvoye par dump n'est pas du meme type") 
self .assertEqual (o2 .a, 1, 

"1'objet renvoye par dump n'a pas la meme valeur a") 
self .assertEqual (o2 .b, 2, 

"1'objet renvoye par dump n'a pas la meme valeur b") 

Utilisation directe d'une classe TestCase 

II y a plusieurs manieres d'utiliser cette classe de test, la plus simple etant d'appeler la 
fonction main() du module unittest, en ajoutant a la fin du module contenant la 
classe une section mai n . 

Ajout d'un appel au framework 

if name == ' main ' : 

unittest.mainO 

mai n() se charge de collecter les tests, de les executer et d'afficher les resultats dans la 
sortie standard. 

Execution du module 

[tziade@Tarek Desktop]! python test_cPickle. py 

Ran 1 test in 0.002s 

OK 

Dans ce mode d'affichage, chaque petit point correspond a un test reussi, un F indi- 
querait un test rate (F pour FAIL) et un E une erreur differente d'une erreur de type 
AssertionError. 

Cet appel permet de valider rapidement un module de test mais ne constitue pas une 
campagne de tests en soi, qui integre generalement plusieurs modules de tests. 

Organisation d'une campagne de tests 

Pour pouvoir lancer une campagne de tests, qui inclut tous les modules de tests du 
programme, il est necessaire de mettre en place un script qui collecte et execute 
l'ensemble des modules de tests disponibles dans un repertoire donne. 
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Ce script se base sur la classe TextTestRunner d'unittest, instanciee lors de l'appel 
de la fonction de lancements de tests main(). 

Cette classe est une implementation par defaut d'une campagne de test, qui collecte 
dans un objet TestResult interne tous les resultats des tests et qui les affiche sur la 
sortie d'erreur standard. 

Une instance de classe TextTestRunner recupere des TestSuite et les execute dans 
un TestSuite global, par le biais de la methode run(). 

TestSuite est une classe basique regroupant des objets de type TestCase, fournis a la 
construction, ou ajoutes par le biais des methodes addTestO ou addTests() . Cette 
classe possede aussi une methode run(). 

Ces deux classes vont permettre au script d'executer les tests contenus dans les diffe- 
rents modules. 

Organisation des modules de tests 

Pour faciliter la tache du script de tests, tous les modules de tests de 1' application doi- 
vent necessairement : 

• avoir un nom avec un prefixe test et un suffixe . py ; 

• se trouver dans un dossier nomme tests, reserve a ce type de scripts. II peut y 
avoir plusieurs dossiers tests dans l'arborescence de 1' application ; 

• contenir une fonction globale get_test_class(), qui renvoie la classe de type 
TestCase a utiliser. Cette fonction peut aussi renvoyer une sequence de plusieurs 
classes a utiliser. 

Script de lancement des tests 

Notre script de lancement de tests prend en parametre un repertoire et effectue une 
recherche dans tous les repertoires tests de l'arborescence. Un TestSuite est 
fabrique pour chaque module de test rencontre dans ces repertoires. Le script lance 
ensuite ces tests par le biais d'un TestRunner. 

Script tester.py 

#! /usr/bi n/python 

• -*- coding: utf8 -*- 
import sys 

from os import getcwd, walk, chdi r 
import os. path 

from optparse import OptionParser 
import unittest 
from warnings import warn 
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options = [{'noms': ('-r', '--repertoire'), 'dest' : 'rep', 

'help': ('Specifie le repertoire a utiliser, si non fourni , 
'le chemin courant est utilise ')}] 

def _print_line() : 
printC-' * 70) 

def main(options , arguments, parser): 
if options. rep isnot None: 

chemin = options. rep 
else: 

if len(arguments) > 0: 
print parser. usage 
sys.exit(2) 
chemin = getcwdO 

chemin = os.path.normpath(chemin) 
if chemin. endswith(os .path. sep) : 
chemin = chemin[:-l] 

printC Parcours du repertoire') 
test_modules = [] 

for racine, reps, fichiers in walk(chemin) : 
dossier = os.path .basename(racine) 
if dossier == 'tests': 

for fichier in fichiers: 

if (fichier. startswith('test') and 
fichier. endswithC .py') and 
fichier != 'test.py'): 

nom_complet = os.path . join(racine, fichier) 
test_modules. append ((nom_complet, fichier[:-3])) 
sys.stdout.writeC . ') 
sys . stdout . f 1 ush () 

print('\n%d module(s) de test trouve(s)\n' % len(test_modules)) 

suite = unittest .TestSuite() 
dernier_contexte = None 
added_paths = [] 

for module in test_modules: 

module_path = os. path.di rname(module[0]) 

# chargement d'un script si necessaire 

contexte = os. path. join(module_path, 'contexte.py') 

if os.path .exists(contexte) and dernier_contexte != contexte: 

execf i 1 e (contexte) 

dernier_contexte = contexte 
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if modul e_path notin sys.path: 
sys . path . append (modul e_path) 
added_paths . append (modul e_path) 

m = import (modul e[l]) 

if 'get_test_class ' in m. diet : 

class_type = m.get_test_class() 

test_suite = unittest .TestSuite(( 

unittest .makeSuite(class_type) , )) 

sui te . addTest (test_sui te) 
else: 

warn("%s n'a pas de fonction get_test_class" % modul e[0]) 

nb_test_case = suite. countTestCases() 
if nb_test_case == 0: 

print('Aucun test.') 

sys.exit(2) 

print('\nLancement de %d test(s)...' % nb_test_case) 

_print_line() 

campagne = unittest .TextTestRunner(verbosity=2) 

campagne . run (sui te) 

for added_path in added_paths: 
sys . path . remove (added_path) 

if name == ' main ': 

parser = OptionParserO 

parser. usage = 'tester [-r repertoire]' 

for option in options: 

param = option['noms'] 

del optionf noms'] 

parser . add_opti on (*param , **opti on) 
options, arguments = parser. parse_args() 
sys.argv[:] = arguments 
main(options , arguments, parser) 

Quelques fonctionnalites annexes ont ete ajoutees : 

• Le programme execute un eventuel script contexte.py s'il est present dans le 
repertoire tests en cours. Ce script peut servir a mettre en place un environne- 
ment de test global sans avoir a le repeter dans chaque module de test. II peut 
contenir entre autres des manipulations du chemin de recherche de l'interpreteur, 
ou des variables d'environnement. 

• Un warning est affiche pour chaque module de test qui n'a pas de fonction 
get_test_class() . 
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A SAVOIR Scripts de tests des frameworks 

Les frameworks de developpement Python, comme Twisted ou Zope, proposent generalement leurs pro- 
pres scripts de tests, plus ou moins similaires a ('implementation presentee et plus ou moins pratiques. 



doctests 



Les doctests offrent une approche complementaire tees interessante pour l'ecriture 
des tests unitaires : il est possible de les inserer directement dans le code a tester. 
Contenus dans les docstrings de toute fonction, methode, classe ou module, les tests 
sont recuperes par un outil specialise, defini dans le module doctest. 

Pour etre reconnus par l'outil, ces tests doivent etre ecrits sous la forme de petites 
sessions de code ressemblant a des sequences d'un prompt Python interactif. 

Exemple de doctest 

def somme(a, b) : 

""" renvoie a + b 

>» somme(2, 2) 

4 

>» somme(2, 4) 

6 
■I ii ii 

return a + b 

L'outil verifie alors que toutes ces sequences, qui sont independantes les unes des 
autres, fonctionnent en les executant. 

Execution des doctests 

Le module doctest fournit une fonction similaire a la fonction main() de unittest, 
qui permet d'executer les tests unitaires contenus dans les docstrings d'un module 
donne. 

Module de code avec appel a testmod 
import doctest 

def somme(a, b) : 

""" renvoie a + b 

>» somme(2, 2) 
4 
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>» somme(2, 4) 
6 

return a + b 

if name == " main ": 

doctest .testmodO 

Appelee avec 1' argument -v, cette fonction detaille dans la sortie standard le travail 
effectue. 

Session de test 

[tziade@Tarek tests] $ python test_doctests.py -v 
Trying: 

somme(2, 2) 
Expecting: 

4 
ok 
Trying: 

somme(2, 4) 
Expecting: 

6 
ok 
1 items had no tests: 

mai n 

1 items passed all tests: 

2 tests in main . somme 

2 tests in 2 items. 

2 passed and failed. 
Test passed. 

Un appel sans parametre sera totalement silencieux dans cet exemple ou le test n'aboutit 
pas a une erreur. En cas de probleme, un message est affiche avec ou sans l'option -v. 

Syntaxe des doctests 

Nous l'avons vu dans 1' exemple precedent, les doctests sont a peu de chose pres des 
copiers-collers de sessions du prompt interactif de Python. lis doivent done con- 
server les meme caracteristiques, et respecter quelques regies particulieres, a savoir : 

• Respect de l'indentation, sachant que toutes les tabulations sont modifiees a la 
volee par des espaces, en utilisant la meme regie que l'analyseur syntaxique de 
l'interpreteur. 

• Sequencage correct des lignes, qui doivent commencer par >» ou par . . . pour le 
code et aucun caractere particulier pour une sortie attendue. 
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• Lorsqu'un saut de ligne est renvoye dans les resultats d'une commande, il ne peut 
pas etre compare a un veritable saut de ligne, interprete par l'outil comme la fin 
d'une sequence. Une ligne contenant la chaine <BLANKLINE> permet d'indiquer a 
l'outil qu'un saut de ligne est attendu a cet endroit. 

• Un docstring etant une chaine de caracteres, il est necessaire de prendre des pre- 
cautions lorsque le caractere antislash (« \ ») est utilise. Pour qu'il soit pris en 
compte sans etre interprete au moment de la lecture de la chaine par l'outil, il est 
necessaire de definir la chaine comme etant de type raw. 

Dans l'extrait de code ci-dessous, la premiere version de docstring provoque une 
erreur SyntaxError a cause de l'antislash. La deuxieme version utilise une chaine de 
caracteres de type raw pour resoudre ce probleme. 

Gestion des antislash 

# docstring de type string 
def test() : 

>» ligne = 'f\n\nf 
>» 

f 

<BLANKLINE> 

f 

ii 11 ii 

pass 

[tziade@Tarek tests] $ python test_doctests.py -v 

File "test_doctests.py" , line 22, in main .test 

Failed example: 
ligne = ' f 
Exception raised: 

Traceback (most recent call last): 

File "/usr/lib/python2 .4/doctest .py" , line 1243, in run 

compileflags, 1) in test. globs 

File "<doctest main .test[0]>", line 1 

ligne = 'f 

A 

SyntaxError: EOL while scanning single-quoted string 

# docstring de type raw 

def test() : 
r """ 

>» ligne = 'f\n\nf 

>» 2 

2 
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pass 

[tziade@Tarek tests] $ python test_doctests.py -v 

Trying: 

2 
Expecting: 

2 
ok 

Une autre particularite de ce type de test unitaire est liee a son fonctionnement 
intrinseque : la reussite du test se basant sur la sortie de l'interpreteur, il est necessaire 
de prendre des precautions lorsque le retour est susceptible de varier. 

C'est le cas par exemple pour les affichages de dictionnaires : l'ordre de sortie n'est pas 
garanti, et peut varier d'une execution a l'autre. II convient dans ce cas de trier le dic- 
tionnaire avant affichage ou de faire des tests sur chaque membre de maniere explicite. 

Precautions d'usage pour les dictionnaires 

def mon_dico() : 

>» mon_dico() [' b'] # test explicite 

2 

>» liste = mon_di co () .items () 

>» liste.sortO 

>» liste # test necessitant un ordre constant 

[('a', 1), C'b\ 2), Cc', 3)] 

return {'a' : 1, 'b' : 2, 'c' : 3} 

Les objets de type float sont egalement a manipuler avec precaution, car les valeurs 
retournees varient d'un systeme a l'autre. Le plus simple etant d'arrondir les valeurs 
comparees par le biais de round () ou de conserver une fraction dont le resultat est a 
coup sur identique sur tous les systemes, a savoir de la forme x/2 . 0**y. 

Les adresses memoire qui peuvent s'afficher lorsque Ton manipule des objets sont 
aussi susceptibles de varier. Un appel a la primitive id() par exemple a toutes les 
chances de retourner un entier different a chaque fois que le test est lance puisqu'il 
est calcule en fonction de l'adresse memoire. Ces valeurs ne peuvent done pas etre 
employees telles quelles dans les tests. 

Pour pouvoir s'affranchir de ce probleme, il est possible dans ce cas de remplacer la 
valeur hexadecimale par des points de suspension (...) representant une ellipse et 
d'activer une option pour le signaler. Cette option est a ajouter en fin de ligne, par un 
marqueur ELLIPSIS. 
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Marqueur Ellipsis 
def mon_objet() : 

>» mon_objet() #doctest: +ELLIPSIS 
<object object at 0x...> 

return object() 
Ce marqueur fait partie d'un ensemble de drapeaux presentes ci-dessous. 

Environnement et options d'execution 

Pour chaque docstring parcouru, un environnement d'execution est cree a partir d'une 
copie des variables globales du module parcouru, renvoyee par global s(). Cette copie 
est abandonnee a la fin du docstring, afin d'eviter tout impact sur les tests suivants. 

II est aussi possible de faire varier le fonctionnement des doctests par le biais 
d'options d'execution, appelees marqueurs. Chaque marqueur peut etre ajoute aux 
lignes des doctests, pour une action locale, ou passe en parametre lorsque tous les 
tests sont lances, pour une action globale. 

Ajouter un marqueur localement se fait en inserant un commentaire en fin de ligne, 
avec le nom du marqueur precede du signe plus (+). 

Les marqueurs globaux quant a eux sont concatenes par des operateurs OR et forment 
le parametre optionflags de la fonction testmod(). 

Insertion d'un marqueur 

# marqueur local 

>» errorO # doctest: +IGNORE_EXCEPTION_DETAIL 

# marqueur global 
importdoctest 

if name == " main ": 

flags = doctest. IGNORE_EXCEPTION_DETAIL 
doctest . testmod (opti onf 1 ags=f 1 ags) 

Les marqueurs disponibles sont : 

• D0NT_ACCEPT_TRUE_F0R_1 : les versions 2.2 et precedentes de Python affichent 
et 1 pour le retour d'une fonction booleenne. Le module doctest accepte done ces 
valeurs en lieu et place de True et False pour que la transition vers des versions 
plus recentes de l'interpreteur ne se fasse pas brutalement. Cette option, qui ne 
peut etre utilisee que globalement, permet de forcer un controle strict. 

• DONT_ACCEPT_BLANKLINE : empeche l'utilisation de <BLANKINE>. S'utilise globa- 
lement. 
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• NORMALIZE_WHITESPACE : normalise les espaces dans la comparaison du resultat. 
Ce drapeau est relativement utile lorsque Ton souhaite tester un retour de fonc- 
tion compose de beaucoup d'espaces, comme les sequences HTML, doctest 
compare ' ' . join(attendu.splitO) et ' ' . join(obtenu.splitO) en lieu et 
place de attendu et obtenu. 

Normalisation des espaces 

def htm~l_b~loc() : 
r """ 

>» html_blocO #doctest: +NORMALIZE_WHITESPACE 
'<HTML>\n <BODY>\n test\n </BODY>\n </HTML>' 

html = <HTML> 

<BODY> 

test 
</BODY> 
</HTML>""" 
return html 

ELLIPSIS 

Vu dans la section precedents pour les adresses memoire, ce marqueur permet de 
remplacer une sequence de caracteres, et correspond a une chaine indefinie de carac- 
teres. 

Ellipsis 
def ellipsisO : 

>» ellipsisO #doctest: +ELLIPSIS 

'a...j' 

>» ellipsisO #doctest: +ELLIPSIS 

'abc. .' 

>» ellipsisO #doctest: +ELLIPSIS 

return 'abcdefghij' 

ICNORE_EXCEPTION_DETAIL 

Permet d'ignorer le texte complet renvoye par une exception et de se contenter de 
comparer uniquement le type d'erreur. Ce marqueur est conseille pour ne pas 
dependre de la pile d'appel ou du texte de l'erreur, susceptible de changer. 

doctest extrait le message d'erreur minimal, a savoir : 

• la premiere ligne : Traceback (most recent call last): 
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• la ligne qui contient le type d'erreur, en ne conservant que ce type. 

Exception detail 

def error() : 

>» errorO #doctest: +IGNORE_EXCEPTION_DETAIL 
Traceback (most recent call last): 
ZeroDivisionError: xx 

return 3/0 

REPORT_NDIFF 

Si ce flag est fourni au lancement des tests, les differences entre le retour et le resultat 
attendu sont affichees sous forme de differences, suivant le format renvoye par le 
module di f f 1 i b, qui fournit un algorithme de comparaison intra-ligne. 

Hortograffe 
def test_orthographe() : 

>» test_orthographe() 

L'orthographe de ce texte est valide. 

return "L'horthografe de ce tecste est validde." 

if name == " main ": 

flags = doctest.REPORT_NDIFF 
doctest . testmod (opti onf 1 ags=f 1 ags) 

[tziade@Tarek tests] $ python test_doctests.py 

ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft ft 

File "test_doctests .py" , line 7, in main .test_orthographe 

Failed example: 

test_orthog raphe () 
Differences (ndiff with -expected +actual): 

- L'orthographe de ce texte est valide. 

? AA A 

+ "L'horthografe de ce tecste est validde." 

? + + A AA + + 

1 items had failures: 

1 of 1 in main .test_orthographe 

***Test Failed*** 1 failures. 
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REPORT_CDIFF 

Meme role que le marqueur precedent pour afficher les differences contextuelles. Les dif- 
ferences contextuelles sont presentees sous la forme de deux blocs de lignes de chaque 
version. Dans une version, chaque ligne peut etre prefrxee d'un caractere special : 

• ! • ligne differente dans l'autre version ; 
ligne n'existant pas dans l'autre version ; 
ligne presente uniquement dans l'autre version. 

Ne fonctionne que pour des textes multilignes de plus de deux lignes. 

Differences contextuelles 

def test_multi "ligne O : 

>» test_mu"lt"Migne() 
1 

2 
4 
5 

print '\n' . join('1234') 

if name == " main ": 

flags = doctest.REPORT_CDIFF 
doctest . testmod(opti onf 1 ags=f 1 ags) 

[tziade@Tarek tests] $ python test_doctests.py 

File "test_doctests. py" , line 7, in main . test_multiligne 

Failed example: 

test_mul ti 1 i gne() 
Differences (context diff with expected followed by actual): 

IV * * IV * '!; * * * * * * * * i; 

*** 1,4 **** 

1 
2 
4 

- 5 

— 1,4 

1 

2 

+ 3 

4 

* * * * * * * * * * ■:- ******** * ***** * * * * * * * * * * * ******** * * * * * * * * * * * * * * * * * ******** * 
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1 items had failures: 

1 of 1 in main .test_mu~lti~ligne 

***Test Failed*** 1 failures. 

REPORT_UDIFF 

Meme role que le marqueur precedent pour afficher les differences unifiees. Les diffe- 
rences sont affichees dans ce cas dans un meme bloc unifie. Le prefrxe ! n'existe done 
pas dans ce cas. Ne fonctionne que pour des textes multilignes de plus de deux lignes. 

Differences unifiees 
def test_multiligne() : 

>» test_multiligne() 

1 

2 

4 

5 

ii ii n 

print '\n' . join('1234') 

if name == " main ": 

flags = doctest.REPORTJJDIFF 
doctest . testmod(opti onf 1 ags=f 1 ags) 

[tziade@Tarek tests] $ python test_doctests.py 

File "test_doctests .py" , line 7, in main .test_multiligne 

Failed example: 

test_mul ti 1 i gne () 
Differences (unified diff with -expected +actual): 

@@ -1,4 +1,4 @@ 

1 

2 
+3 

4 
-5 

1 items had failures: 

1 of 1 in main .test_multiligne 

***Test Failed*** 1 failures. 
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REPORT_ONLY_FIRST_FAILURE 

Ce marqueur global permet de specifier que pour chaque sequence, seule la premiere 
comparaison qui echoue est reportee. Le reste de la sequence est executee mais plus 
aucune erreur n'est reportee. Utilise pour minimiser le retour des tests des lors que 
des problemes sont rencontres. 

doctests dans un fichier texte separe 

Des fichiers textes peuvent aussi etre dedies aux doctests : l'outil parcourt dans ce cas 
les lignes et execute le contenu comme un seul et meme docstring. Cette technique 
permet de reunir tous les tests dans un seul et meme module, pour revenir a un principe 
similaire aux tests unitaires, mais avec toute la puissance narrative des doctests en plus. 

Les exemples de code s'alternent de commentaires, dans un flux continu et directe- 
ment lisible. Au fur et a mesure de revolution du code, des exemples de plus en plus 
complexes et des cas particuliers s'ajoutent a ce fichier, qui devient une documenta- 
tion complete a progression logique. 

L'exemple ci-dessous reprend l'exemple des tests sur cPickle, pour une ecriture equi- 
valente en doctests. 

test_cPickle.txt 

le module cPickle permet de sauvegarder des 

objets sur le systeme de fichiers ou dans tout autre flux. 

>» import cPickle 

Prenons l'exemple d'une classe classique 
et une instance de cette classe 
que nous allons sauvegarder 

>» from UserDict import UserDict 

>» o = UserDictO 

>» o['a'] = 1 

>» o['b'] = 2 

Pour sauver l'objet, cPickle prend en parametre 
un objet de type file, ouvert par nos soins 

>» fie = open ('/home/tziade/pi ckled.bin' , 'w') 

La fonction dump se charge de la serialisation 

>» cPickle. dump (o, fie) 

fermons le fichier 
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>» fic.close() 

Pour recuperer l'objet, il suffit d'ouvrir un 

flux sur le fichier et d'utiliser la fonction load() 

>» fie = open ('/home/tziade/pi ckled.bin') 
>» o2 = cPickle.load(fic) 

Verifions les valeurs de 1'objet renvoye 

>» isinstance(o2 , UserDict) 

True 

>» o2['a'] 

1 

>» o2['b'] 

2 

L' execution d'un fichier de doctests se fait par la fonction testfi 1 e() de doctest. 

Cette fonction prend, entre autres parametres, module_relative, qui specifie si les 
chemins importes dans les tests sont relatifs au repertoire du module appelant ou 
dependants du systeme, e'est-a-dire de sys . path. 

Dans l'exemple ci-dessous, ce parametre est a False car le test est appele depuis 
l'interpreteur interactif 

verbose determine la quantite d'informations affichee. II est a False par defaut et 
n'affiche rien sauf en cas d'erreur. 

Execution du fichier test cPickle.txt 

>» import doctest 

>» doctest . testfi 1 e ( ' test_cPi ckl e . txt ' , modul e_rel ati ve=Fal se , 

verbose=True) 

Trying: 

import cPickle 
Expecting nothing 
ok 
Trying: 

from UserDict import UserDict 
Expecting nothing 
ok 
Trying: 

o = UserDictO 
Expecting nothing 
ok 
Trying: 

o['a'] = 1 
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Expecting nothing 

ok 

Trying: 

orb'] = 2 
Expecting nothing 
ok 
Trying: 

fie = open ('/home/tziade/pi ckled.bin' , 'w') 
Expecting nothing 
ok 
Trying: 

cPickle.dump(o, fie) 
Expecting nothing 
ok 
Trying: 

fic.close() 
Expecting nothing 
ok 
Trying: 

fie = open('/home/tziade/pickled.bin') 
Expecting nothing 
ok 
Trying: 

o2 = cPickle. "load (fie) 
Expecting nothing 
ok 
Trying: 

isinstance(o2 , UserDict) 
Expecting: 

True 
ok 
Trying: 

o2['a'] 
Expecting: 

1 
ok 
Trying: 

02['b'] 
Expecting: 

2 
ok 
1 items passed all tests: 

13 tests in test_cPickle.txt 
13 tests in 1 items. 
13 passed and failed. 
Test passed. 

*** DocTestRunner. merge: 'test_cPickle.txt' in both testers; summing 
outcomes. 
(0, 13) 
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Script de test 

Le script de lancement des tests unitaires vu precedemment peut etre modifie pour 
prendre en compte les doctests des modules de code rencontres sur le chemin, et les 
fichiers textes de tests. Dans l'extension proposee, ces derniers doivent etre prefixes 
par test et suffixes par .txt. 

doctest fournit des objets permettant de transformer les tests extraits des docstrings 
en objets de type TestCase, qui peuvent etre inseres dans les test suites. 

Script tester.py modifie 

import doctest 
[...] 

def main (options , arguments, parser): 

print(' Parcours du repertoire') 
test_modules = [] 

for racine, reps, fichiers in walk(chemin) : 
for fichier in fichiers: 

if ((fichier .endswithC . py') or fichier. endswithC .txt ')) and 
fichier notin ('test.py', 'test .txt')) : 
nom_complet = os.path. join (racine, fichier) 
tests = os.path .basename(racine) == 'tests' 
test_modul es. append ((nom_complet, fichier .splitC ■ ') [0] , 

tests)) 
sys.stdout.writeC . ') 
sys . stdout . fl ush() 

for fichier, module, dossier_tests in test_modules: 
module_path = os. path.di rname(fichier) 
if module_path notin sys. path: 

sys . path . append (modul e_path) 

added_paths . append (modul e_path) 

# chargement d'un contexte si necessai re 
if dossier_tests: 

contexte = os .path. join(module_path , ' contexte. py') 
else: 

contexte = os .path. join(module_path , ' tests_contexte.py ') 

if os.path .exists(contexte) and dernier_contexte != contexte: 
execf i 1 e (contexte) 
dernier_contexte = contexte 
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# fichiers textes de type doctests 

if fichier.endswithC .txt ') and dossier_tests: 

doc_f"Me_suite = doctest .DocFileSuite(fichier, 
modul e_rel ati ve=Fal se) 

sun te . addTest (doc_fi 1 e_sui te) 
continue 

# fichiers de tests unitaires 

if module. startswith('test') and dossier_tests : 
m = import (module) 

if 'get_test_class' in m. diet : 

class_type = m.get_test_class() 

test_suite = unittest.TestSuite(( 

unittest.makeSuite(class_type) , )) 

sui te . addTest (test_sui te) 
else: 

warn("%s n'a pas de fonction get_test_class" % fichier) 

# parcours de tous les fichiers de code pour les doctests 
ifnot dossier_tests and fichier.endswithC . py') : 

m = import (module) 

try: 

doc_test_suite = doctest. DocTestSuite(m) 
except ValueError: 

# pas de doctests 

pass 
else: 

sui te . addTest (doc_test_sui te) 

Ce script introduit en outre une variation sur les fichiers de contexte, qui restent 
nommes contexte. py dans les repertoires tests et deviennent tests_contexte.py 
en dehors. Cette modification permet de lancer un script de contexte associe a des 
repertoires contenant des scripts Python qui sont scannes pour les doctests. 



Coverage 



Le coverage est un complement utile qui permet de traquer le code non couvert par 
les tests unitaires. Les implementations existantes de scripts de coverage se basent sur 
la fonction sys.settrace() qui permet d'associer une fonction a toute execution de 
code. Cette fonction sera appelee a chaque fonction ou methode visitee, et peut etre 
combinee avec une deuxieme fonction qui sera invoquee pour chaque ligne visitee. 

Le module trace de la bibliotheque standard est un exemple d'implementation de 
sett race (). II fournit un objet Trace, qui prend en parametre le code a executer et 
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concocte un fichier d'extension .cover, similaire au code execute, mais avec des 
informations ajoutees a chaque debut de ligne. 

Exemple d'utilisation de trace 

#!/usr/bin/python 
# -*- coding: utf8 -*- 
import trace 
import sys 

def methode2(x) : 
if x % 2: 

return 'o' 
if x == 123: 

return '0' 



def methodeO : 
c = " 

for i in range(lOO): 
c = c + methode2(i) 

if name == ' main ' : 

traced = trace. Trace(ignoredi rs=[sys. prefix, 

sys.exec_prefix,] , trace=0, 

count=l) 
traced, run ('methodeO ') 

r = traced. results() 

r . wri te_resul ts (show_mi ssi ng=True) 

results = open('tracer. cover' , 'r') 
print(' ' .join (results. readlines())) 
results. close() 

[tziade@Tarek Desktop] $ python tracer. py 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

import trace 
»»» import sys 

»»» def methode2(x): 
100: if x % 2: 

50: return 'o' 

50: if x == 123: 
»»» return '0' 

50: return 'x' 
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1 
101 

100 



def methodeO : 
c = " 

for i in range(lOO): 
c = c + methode2(i) 



»»» if name == ' main ' : 

»»» traced = trace. Trace(ignoredi rs=[sys. prefix, 

sys.exec_prefix,] , trace=0, 

»»» count=l) 

»»» traced. run('methode() ') 

»»» r = traced. results() 

»»» r.write_results(show_missing=True) 

»»» results = open('tracer. cover' , ' r 1 ) 

»»» print ' ' . join(results. readlinesO) 

»»» results. close() 

trace prefixe les lignes non executees du code par »»» et par le nombre d'appels 

pour les autres. Les lignes de la section mai n ne sont pas a prendre en compte 

car non tracees. En termes d'interpretation, ce test permet de deceler que le cas x == 
123 nest jamais visite par le code appelant. 

D'autres implementations existent en dehors de la bibliotheque standard, comme le 
module cove rage, py de Gareth Rees, du projet Perforce Defect Tracking Integration 
(http://www.ravenbrook.com/project/p4dti/). Le principe est identique mais cette ver- 
sion est beaucoup plus interessante dans le cadre des tests unitaires car les informa- 
tions collectees sont regroupees et affichees dans un tableau ou chaque module utilise 
dans les tests se voit attribuer un pourcentage de couverture. 

Resultats de coverage.py 

[tziade@Tarek tests] $ coverage.py -x tester. py 
Parcours du repertoire 



7 module(s) de test trouve(s) 
Lancement de 4 test(s)... 



test l'E/S de cPickle ... ok 
test le monkey patching ... ok 
test_patch2 (test_i mapl i b . SMTPTestCase) 
test_patchR (test_i mapl i b . SMTPTestCase) 



.. ok 
.. ok 



Ran 4 tests in 0.003s 
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OK 

[tziade@Tarek tests] $ coverage -r 

Name Stmts ExecCover 



base64 


173 


30 


17% 


um'ttest 


464 


226 


48% 


test doctests 


33 


12 


36% 


dis 


179 


16 


8% 


test_imap~lib3 


6 


3 


50% 


gettext 


368 


119 


32% 


sre_compile 


387 


265 


68% 


trace 


471 


46 


9% 


sre parse 


605 


320 


52% 


bdb 


416 


65 


15% 


in it 


11 


5 


45% 


warnings 


183 


58 


31% 


[...] 








traceback 


189 


22 


11% 


doctest 


950 


143 


15% 


difflib 


656 


59 


8% 


future 


22 


17 


77% 


inspect 


474 


57 


12% 



TOTAL 



15632 3625 



23 



Des ameliorations peuvent etre apportees a ce script, notamment en filtrant les 
modules des bibliotheques pour n'afficher que les modules du programme. 



Integration dans I'environnement d'un projet 

Les tests constituent la principale assurance qualite du code d'un programme, et 
s'integrent facilement a la vie d'un projet, voire d'une maniere plus globale, a la cul- 
ture d'entreprise ou communautaire. 

Les projets Open Source ont ete historiquement parmi les premiers a reellement 
adopter ce modele de programmation : le nombre d'acteurs impliques et leur eloi- 
gnement geographique ont force a rendre les projets de plus en plus autonomes des 
developpeurs en termes de controle qualite. 

Si les nouveaux arrivants proposent des modifications dans le code, les tests unitaires 
qui accompagnent ces modifications facilitent considerablement le travail de sur- 
veillance des developpeurs principaux du projet, et font bien souvent partie de la 
charte de participation au projet : « no test, no commit » (pas de test, pas de soumis- 
sion de code). 
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Mais ces echanges doivent etre formalises par des outils supplementaires pour faci- 
liter la gestion du code du projet, et l'acces a ces outils doit etre direct pour toute per- 
sonne impliquee dans le projet. 

Le projet Python est un exemple flagrant de ce besoin : avant la version 2 du langage, 
toutes les modifications proposees etaient envoyees a Guido van Rossum par e-mail 
sous forme de fichiers di f f ou python. Ce dernier acceptait ou refusait l'ajout. Dans 
le premier cas, il ajoutait le code dans son CVS personnel pour le diffuser ensuite. La 
boite e-mail de Guido van Rossum etait done le goulot d'etranglement de l'avancee 
du projet Python. 

A l'instar de Sourceforge, un projet base sur la programmation dirigee par les tests 
peut mettre en place : 

• Un gestionnaire de version, comme SVN ou CVS, qui permet aux developpeurs 
de mettre a jour ou recuperer le code centralise (code repository), et au systeme de 
conserver toutes les versions du code. 

• Un systeme de scripts, qui permet de lancer des campagnes de tests et de cove- 
rage, a l'instar des scripts presentes dans ce chapitre. 

• Des scripts de controle qualite, comme PyLint (http://www.logilab.org/projects/ 
pylint), qui met entre autres en evidence les directives d'importations non utilisees 
et PyChecker (http://pychecker.sourceforge.net/), qui effectue un controle pousse 
sur le code et signale par exemple des objets instancies mais jamais utilises, ou des 
portions de code qui ne peuvent pas etre appelees. 

• Un automate, comme BuildBot (http://buildbot.sourceforge.net/), qui lance a cha- 
que modification du code une campagne de tests sur plusieurs environnements 
d'execution, et envoie des e-mails d'avertissement aux developpeurs en cas de pro- 
bleme (code en Python). 

• Des outils de gestion de listes de diffusion, comme Mailman (http://www.gnu.org/ 
software/mailman/) (code en Python). 

• Un site permettant de visualiser le code et les modifications, comme le systeme 
Trac (http://www.edgewall.com/trac/) (code en Python), etc. 



Le futur de PyUnit 

PyUnit herite de la lourdeur de son modele Java. Ecrire un simple test pour verifier 
une valeur necessite beaucoup de boiler-plate < 
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Un simple test avec PyUnit 



>» import unittest 

>» class MyTestCase(unittest .TestCase) : 

... def test_one(self) : 

... self .assertEquals(sum((2 , 3)), 5) 



II est necessaire d'equiper les modules de test de code supplemental pour construire 
des suites de tests. Enfin, pour lancer une campagne de test, un script qui collecte les 
tests devient vite indispensable. 

PyUnit impose des methodes pour les assertions reprises de Java, qui sont verbeuses. 
Le seul merite de cette similitude etant de permettre a un developpeur maitrisant 
J unit d'etre productif directement avec PyUnit et inversement. 

Toute cette infrastructure alors que le seul test tient en une ligne ! 
Test nu 
>» assert sum((2, 3)), 5 

Des projets communautaires proposent des alternatives interessantes, qui resolvent 
ces defauts de PyUnit. Nose (http://somethingaboutorange.com/mrl/projects/nose/) est 
probablement le projet le plus interessant. II se base sur de simples conventions de 
nommage pour l'ecriture de tests et fournit un script qui collecte automatiquement 
les modules dont le nom commence par test. Les tests en eux-memes peuvent etre 
de simples fonctions du moment qu'elles utilisent aussi un prefixe test. 

Test compatible Nose 

>» def test_one(): 

assert sum((2, 3)), 5 



L'interet de Nose est de lancer egalement les tests ecrits classiquement avec 
unittest. 

II est possible qua terme unittest soit remplace par un outil aux fonctionnalites 
proches de Nose. Des travaux communautaires laisseraient supposer que cette modi- 
fication aura lieu dans les annees a venir. 
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En un mot... 



Adopter les techniques presentees dans ce chapitre est un atout considerable pour 
augmenter la qualite d'une application et la facilite avec laquelle un developpeur peut 
la modifier, que ce soit en Python ou dans un autre langage. 

Si cette technique est combinee a de bonnes pratiques, presentees dans le prochain 
chapitre, elle fait de Python un langage a l'aise dans la plupart des domaines. 
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Bonnes pratiques et 
optimisation du code 



Oh ! Come and see the violence Inherent in the system I — The Holy Grail 
« Oh ! Venez tous voir la violence qui se cache sous ce systeme ! » 

— Sacre Graal 



Python est souvent montre du doigt comme un langage lent. Constat evident 
puisqu'il est base sur de l'interpretation et non sur de la compilation. Mais un pro- 
gramme Python bien ecrit base la plupart du temps son travail sur des appels les plus 
directs a la couche compilee en C des bibliotheques. La vitesse d'un programme est 
done inversement proportionnelle a la couche de code Python a traverser. 

Ce chapitre presente les outils et les bons reflexes a prendre pour rendre un pro- 
gramme le plus performant possible. Si les performances atteintes ne sont pas encore 
suffisantes, ce qui peut arriver dans certains domaines specifiques comme les calculs 
matriciels dans les jeux, des bibliotheques ou des techniques specifiques permettent 
de pallier ce probleme. 

Le programme est encore trop lent ? II reste possible de passer du cote obscur de la 
force, en codant tout ou partie du code dans une extension au langage en C. 
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Quand optimiser ? 

II est deconseille de tenter d'optimiser son code au moment de sa premiere ecriture, 
car cette approche a pour consequence de complexifier l'objectif premier : concevoir 
un code qui fonctionne. 

De plus, il est quasiment impossible d'identifier a l'avance, sauf pour les cas isoles ou 
bien precis, les enchainements de code qui provoqueront de reelles lenteurs poten- 
tiellement eradicables. Calculer la complexite d'un algorithme est une chose, prevoir 
toutes les combinaisons d'enchainements et d'imbrications possibles d'un applicatif 
en est une autre. 

L'optimisation ne s'opere done que lorsque Ton constate que l'une des fonctionna- 
lites de 1' applicatif n'est pas conforme aux attentes en termes de rapidite d'execution, 
meme s'il est possible comme nous le verrons en fin de chapitre de proceder a des 
tests de performance continus. 

Cette optimisation se base sur une recherche du goulot d'etranglement, ou bottleneck, 
et dans le meilleur des cas a son eradication par une modification d'une partie du 
code. Parfois, tout ou partie de l'architecture du programme est remise en cause et 
une refonte plus profonde peut etre necessaire. On parle alors de refactoring. 

La recherche du goulot d'etranglement se fait par le biais du profiling, qui consiste a 
mesurer les performances d'une fonctionnalite en chronometrant la duree d'execu- 
tion de chacun des acteurs. Cet exercice permet en outre de deceler d'autres types 
d'anomalies. 

Une fois le coupable identifie, une decision doit etre prise pour ameliorer les perfor- 
mances. 

Enfin, des tests de performance continus peuvent etre mis en place, pour garantir, de 
la meme maniere que pour les tests unitaires, qu'il n'y a pas de regression au niveau 
de la rapidite de l'applicatif : chaque introduction ou modification de code pouvant 
potentiellement creer un nouveau goulot d'etranglement. 

Cette derniere demarche a en outre l'avantage de rendre le developpeur de plus en 
plus proactif sur les problemes de performances, il les decele des leur introduction. 



Profiling 



Le profiling permet de reperer rapidement les portions de code les plus lentes pour 
les modifier. D'autres anomalies peuvent etre decelees par les profilers, a savoir : 
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• Des erreurs logiques : certaines fonctions s'executent un nombre anormal de fois, 
pas assez ou trop souvent. 

• Des bottlenecks restes inapercus : une fonction a priori anodine apparait comme 
une source de ralentissements importants, soit par sa lenteur, soit par un nombre 
enorme d'appels. 

• Des erreurs de conception : les statistiques remontees par le profiler offrent une 
vision particuliere du programme, et peuvent parfois attirer 1' attention sur des 
problemes de conception. 

Methodes de profiling 

II existe plusieurs methodes pour profiler le code. L'approche la plus courante con- 
siste a mesurer le temps passe dans chacune des methodes et fonctions traversees. 
C'est une methode deterministe qui se base sur les memes techniques que le coverage 
vu dans le chapitre precedent. On dresse un tableau du code appele, avec des infor- 
mations annexes comme : 

• le nombre d'appels ; 

• la liste des appelants, c'est-a-dire les fonctions qui utilisent le code en cours ; 

• la liste des appeles, c'est-a-dire les fonctions appelees par le code en cours. 

Une autre methode beaucoup plus abstraite et moins facile a mettre en ceuvre, con- 
siste a recuperer des echantillons aleatoires d'instructions executees et a en deduire ou 
l'interpreteur passe le plus de temps. 

Nous l'avons vu pour le coverage, Python fournit tous les points d'entree necessaires 
pour mettre en place facilement une solution deterministe. C'est cette approche qui 
est implementee par plusieurs modules de la bibliotheque standard. L'utilisation d'un 
tel outillage allonge les temps d'execution, mais ne remet generalement pas en cause 
l'interpretation des resultats, car ce ralentissement est ridicule par rapport a la duree 
d'execution de n'importe quelle fonction. 

Outils de profiling 

II existe differents outils de profiling dans la bibliotheque standard. Le plus connu est 
profile. 

Le module profile 

profile peut etre directement utilise en ligne de commande pour tester un pro- 
gramme Python. 
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Utilisation de profile 

$ python -m "profile" --help 

Usage: profile.py [-o output_file_path] [-s sort] scriptfile [arg] 

Options: 

-h, --help show this help message and exit 

-o OUTFILE, --outfile=OUTFILE 

Save stats to <outfile> 
-s SORT, --sort=SORT Sort order when printing to stdout, based on 

pstats. Stats class 

$ python -m "profile" -s time 
listbench. py 

155 function calls in 30.830 CPU seconds 

Ordered by: internal time 

ncalls tottime percall cumtime percall filename: lineno(f unction) 

17.120 listbench.py:19(fonc2) 
13.000 listbench.py:14(foncl) 
0.417 :0(range) 
0.515 :0(join) 
30.810 listbench.py:2(?) 
15.070 listbench. py:7(duree) 
0.020 :0(setprofile) 



1 


16.760 


16.760 


17.120 


1 


11.160 


11.160 


13.000 


3 


1.250 


0.417 


1.250 


2 


1.030 


0.515 


1.030 


1 


0.590 


0.590 


30.810 


2 


0.020 


0.010 


30.140 


1 


0.020 


0.020 


0.020 



Le module hotshot 

Un nouveau module plus rapide et complet a ete introduit a la version 2.2 : hotshot. 

Les fonctionnalites de hotshot sont similaires au module profile, mais reduisent 
l'impact sur les performances introduites par l'outillage mis en place pour le 
profiling : le code est majoritairement ecrit en C. 

hotshot definit une unique classe Profile, permettant de creer des instances de pro- 
filer, ainsi qu'une fonction hotshot. stats. load(logfile), qui permet de charger et 
renvoyer les resultats du profiler dans un objet de type Stats, du module pstats. 

class Profile(logfile[, lineevents[, linetimings]]) 

Creer une instance de profiler se fait en fournissant un nom de fichier logfile, uti- 
lise pour stocker les donnees recoltees par le profiling. 

lineevents determine la granularite du profiler, a savoir si seuls les appels de 
methodes ou fonctions sont enregistrees (0 ou non defini) ou si toutes les lignes de 
code sont observees (1). 
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line-timings, a defaut a 1, determine si les informations de temps sont enregistrees 
pendant le travail de profiling. 

Une fois l'objet cree, il fournit un certain nombre de methodes decrites ci-dessous : 

startO 

Lance le profiler. 

stopO 

Stoppe le profiler. 

closeO 

Ferme le fichier de log et termine le profiler. 

run(cmd) 

Lance le profiling du code cmd. cmd est une chaine de caracteres qui represente du 
code Python executable. Lenvironnement d'execution est defini par les variables glo- 
bales de mai n . 

runcall(func, *args, **keywords) 

Appelle la fonction ou methode func, avec des arguments si necessaire. Le resultat 
de 1' execution est renvoye et les eventuelles erreurs levees remontent comme si le 
code avait ete appele directement. 

runctx(cmd, globals, locals) 

Equivalente a run(), avec la possibilite de fournir un environnement d'execution par- 
ticulier. 

fileno() 

Renvoie le numero de descripteur du fichier de log. 

Le module cProfile 

cProfile est un module equivalent a profile, mais plus rapide car code partielle- 
ment en C. II s'utilise de la meme maniere. 

Utilisation de cProfile 

$ python -m "cProfile" --help 

Usage: cProfile. py [-o output_file_path] [-s sort] scriptfile [arg] ... 
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Options : 

-h, --help show this help message and exit 

-o OUTFILE, --outfile=OUTFILE 

Save stats to <outfile> 
-s SORT, --sort=SORT Sort order when printing to stdout, based on 

pstats. Stats class 

Le module pstats 

Chaque profiler genere ses resultats et les ecrit dans un fichier, dans un format 
binaire, lisible par les objets Stats du module pstats. L'affichage des resultats d'un 
profiling doivent done se faire par ce biais. 

Les methodes les plus importantes de la classe Stats sont : 

print stats([restriction, ...]) 

Cette methode permet d'afficher les donnees de profiling, restriction represente 
un certain nombre de parametres optionnels qui permettent de filtrer la liste affichee. 

Chaque parametre peut etre sous la forme : 

• d'un objet string : represente une expression reguliere qui permet de filtrer les 
lignes en fonction de chaque nom de module affiche en debut de ligne ; 

• d'un entier : definit le nombre de lignes maximum a afficher ; 

• d'un nombre reel compris entre . et 1 . : definit le pourcentage de la liste a 
afficher. 

La classe filtre la liste en appliquant les filtres un a un. 

print callers([restriction, ...]) 

Permet de lister l'ensemble des fonctions appelantes du log de profiling. Chaque 
fonction appelee est placee entre parentheses. Peut etre filtree comme pri nt_stats. 

print callees([restriction, ...]) 

Permet de lister l'ensemble des fonctions appelees du log de profiling. Chaque fonction a 
l'origine de l'appel est placee entre parentheses. Peut etre filtree comme pri nt_stats. 

sort stats(key[, ...]) 

Permet de trier la liste en fonction du parametre key. key est une chaine a prendre 
dans la liste suivante : 

• cal 1 s : nombre d'appels (tri decroissant) ; 

• cumulative : temps cumule (tri decroissant) ; 

• f i 1 e : nom du fichier source (tri alphabetique) ; 
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• modul e : nom du module (tri alphabetique) ; 

• peal 1 s : nombre d'appels primitifs (tri decroissant) ; 

• line : numero de ligne (tri decroissant) ; 

• name : nom de la fonction (tri alphabetique) ; 

• nf 1 : nom, fichier, ligne (tri alphabetique) ; 

• stdname : nom standard (tri alphabetique) ; 

• time : temps interne d'execution (tri decroissant). 

Plusieurs cles peuvent etre fournies pour composer un tri multicritere. La methode 
reverse_order() permet egalement d'inverser le tri obtenu, sachant que les tris 
appliques par sort_stats() permettent de placer vers le haut de la liste les appels les 
plus couteux. 

hotshot et pstats 

Les deux modules presentes fournissent un outil complet de profiling. Lexemple ci- 
dessous affiche la liste des methodes appelees par le profiler, triees par nombre d'appels. 

profiling.py 

#!/usr/bin/python 

• -*- coding: utf8 -*- 
import hotshot 
import hotshot. stats 

def methodel(chaine) : 

return reversed(chaine) 

def methode2(chaine) : 
if len(chaine) % 2: 

return methodel(chaine) 
else: 

return chaine 

def methode3(chaine) : 
ch = [] 
for i in range(3) : 

ch. extend (methode2 (chaine)) 
return ' ' . join(ch) 

def methode4() : 
o = " 
for i in range(5000): 

o += methode3(str(i)) 
return methodel(o) 
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profiler = hotshot. Profile("statistiques. prf") 
profiler. runcall (methode4) 
profiler. close() 

stats = hotshot. stats. load("statistiques. prf") 

# trie suivant le nombre d'appels 
stats. sort_stats(' calls ') 
stats . pri nt_stats() 

$ python profiling.py 

22732 function calls in 0.142 CPU seconds 

Ordered by: call count 

ncalls tottime percall cumtime percall filename: lineno(f unction) 

15000 0.046 0.000 0.059 0.000 profiling. py:10(methode2) 

5000 0.058 0.000 0.117 0.000 profiling.py :16(methode3) 

2731 0.014 0.000 0.014 0.000 profiling.py : 7(methodel) 

1 0.024 0.024 0.142 0.142 profil ing . py : 22(methode4) 

0.000 0.000 profile:0(profiler) 

timeit 

hotshot peut etre lourd a mettre en place lorsqu'il s'agit de mesurer rapidement les 
performances d'une seule fonction independante ou d'une sequence de code extraite. 

Le module timeit, introduit a la version 2.3, repond a ce besoin en fournissant un 
outil leger, beaucoup plus simple a mettre en oeuvre. 

timeit fournit une classe Timer, qui prend en parametre l'expression a mesurer, et 
fournit une methode d'execution. 

class Timer([stmt='pass' [, setup='pass' [, timer=<timer function>]]]) 

stmt est l'expression a mesurer, setup une eventuelle deuxieme expression, qui sera exe- 
cuted avant stmt. Comme Timer desactive le garbage collector pour essayer de mini- 
miser les differences introduites par la gestion de la memoire qui depend d'elements 
contenus en dehors des tests, setup peut etre utilise pour le reactiver ( ' gc . enabl e() ' ), 
et ceci pour obtenir un test plus realiste lorsque le code teste parcourt plusieurs niveaux. 
Le temps pris par le garbage collector nest pas negligeable dans ces cas la. 

Enfin, time est une fonction qui peut etre fournie pour mesurer les temps. La fonction 
interne utilisee par defaut se base sur la fonction systeme time.clock() pour MS- 
Windows et time.timeO sous Unix, pour obtenir la meme precision de l/100 e de 
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seconde sur les deux plates-formes. (time.timeO atteint l/60 e de seconde sous 
MS-Windows). 

De plus, les temps renvoyes dans ce cas ne sont pas les temps de consommation CPU 
mais les temps relatifs. Cela signifie que certaines variations peuvent etre observees 
lorsque d'autres processus sont actifs sur la machine de tests. 

Pour obtenir un temps le plus proche de la realite, il est judicieux d'executer trois fois 
de suite la mesure par repeat () et recuperer le meilleur temps des trois. 

timeit([number= 1 000000]) 

Execute l'expression setup puis l'expression stmt fournies a la construction de l'ins- 
tance. Si number est fourni, il determine le nombre d'executions de stmt. Comme 
time-it est oriente code patterns, c'est-a-dire qu'il est en general employe pour opti- 
miser de tres courtes sequences de code, number est a defaut a un million. 

La methode renvoie le temps d'execution. 

repeat([repeat=3 [, number= 1000000]]) 

Methode complementaire, qui permet d'appeler timeitO repeat fois, en lui passant 
si fourni, le parametre number. 

Dans l'exemple ci-dessous, time-it est utilisee pour comparer deux algorithmes qui 
ont le meme objectif 

Comparaison 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

def algolO: 

chaine = ' ' 

for i in range(100000) : 
chaine += '••' 

return chaine 

def algo2(): 
chaine = [] 

for i in range(100000) : 
chaine. append('*') 
return ' ' . join(chaine) 

if name ==' main ': 

from timeit import Timer 

t = Timer('algol() ' , 'from main import algol') 

print 'execution algo 1: %f % t.timeit(lO) 
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t = Timer ('algo2() ' , 'from main import algo2') 

print 'execution algo 2: %f % t.timeit(lO) 

Elle permet de constater les differences entre les deux options, et aussi pour ce cas 
precis, revolution interne de la gestion des chaines entre Python 2.3 et 2.4. 

Exemple d'optimisations entre Pyhton 2.3 et Python 2.4 

$ python2.3 timing.py 
execution algo 1: 14.064436 
execution algo 2: 0.703696 

$ python2.4 timing.py 
execution algo 1: 0.314968 
execution algo 2: 0.482306 



Amelioration des performances 



Une fois le probleme repere par le profiler, plusieurs techniques existent pour reduire 
le temps d'execution. 

La plupart du temps une legere modification du code suffit a regler le probleme. Si la 
solution a appliquer n'est pas flagrante, il peut etre necessaire de rechercher un code 
de remplacement dans la liste des code patterns fournis ci-dessous. 

Ces code patterns, ou portions de codes, sont des techniques eprouvees pour effec- 
tuer un travail precis, le plus rapidement possible. 

Python est un langage base sur le langage C : chaque sequence de code resulte en une 
serie d'appels a des primitives de bas niveau codees en C. 

Certaines fonctions sont des liens directs vers des primitives C et d'autres doivent 
traverser des couches plus epaisses d'appels de code Python. 

Favoriser l'usage de fonctions proches du C augmente done de maniere tees impor- 
tante les performances. 

Si ces modifications ne permettent pas de resoudre le probleme, d'autres voies sont 
possibles : 

• Le caching, qui consiste a conserver en memoire les resultats d'un calcul couteux, 
pour pouvoir les resservir en cas de besoin. 

• Le multithreading, qui permet d'executer du code en tache de fond. 

• La programmation en C d'une extension du langage. 

• Lutilisation de bibliotheques de calcul specialisees. 

• Lutilisation d'outils de programmation comme Cython. 
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Code patterns 

La distinction n'etant pas toujours faite dans la litterature informatique, il est impor- 
tant de preciser ici que les code patterns sont a differencier des design patterns : ils 
s'apparentent plus a des petites sequences de code souvent utilisees pour repondre a 
des besoins communs comme la concatenation de chaines, le tri d'elements, ou les 
bonnes habitudes a prendre lorsque Ton manipule certains objets. 

Les design patterns, presentes au prochain chapitre, concernent des elements de code de 
plus haut niveau comme des classes ou des groupes de classes, et repondent a un besoin 
plus specifique de conception, comme les generateurs d'objets, les mediateurs, etc. 

Void une liste non exhaustive de code patterns eprouves, pouvant etre reutilises pour 
les meilleures performances possibles. 

Quel type de conteneur choisir ? 

Lorsque des elements doivent etre regroupes dans un conteneur, plusieurs choix sont 
possibles : 

• Le type 1 i st offre de nombreuses fonctionnalites pour la gestion d'elements hete- 
rogenes ordonnes. 

• Le type set offre un conteneur performant a condition que les elements soient 
uniques. 

• Le type tuple permet de creer des sequences non modifiables, et prend moins de 
place en memoire. 

• Le di cti onnai re est a preferer aux sequences lorsque l'ordre des elements regrou- 
pes ha pas d'importance. La cle peut contenir un identifiant unique, susceptible 
d'etre utilise dans des recherches sur les elements. 

• Le type array est plus rapide pour des sequences d'elements simples homogenes. 



A SAVOIR Remplacer le type Array 

II existe des bibliotheques tierces specialises 
annexe B). 


qui 


remplacent avantageusement Array (presentees 


en 



Trier des valeurs 

Le tri en Python s'effectue en utilisant des objets de type list, qui disposent d'une 
methode sort(). Cette methode trie les valeurs de la liste en les comparant et 
effectue son travail inplace, c'est-a-dire en appliquant les modifications directement a 
l'objet sans en renvoyer un nouveau. Ce tri est de type quicksort et implemente en C, 
done tres rapide. 
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A RETENIR Exemples a suivre 

Dans les exemples qui suivent, on considere que la liste est composee uniquement d'elements du meme 
type. 



Tri simple 

>» liste = [1, 3, 2] 

>» liste. sort () 

>» liste 

[1, 2, 3] 

Le tri par defaut est croissant, mais une fonction peut etre passee en parametre pour 
determiner l'algorithme de comparaison. La fonction recoit deux elements de la liste 
et doit renvoyer un entier pour determiner l'ordre de ces deux objets : negative, posi- 
tive ou nulle si les objets sont estimes egaux. 

Tri parametre 



>» liste = [1, 3, 2] 
>» def mon_tri (ell, el 2): 
if ell > e!2: 

return -1 
if e!2 < e!2: 

return 1 
return 

>» liste. sort(mon_tri) 
>» liste 
[3, 2, 1] 



Cette technique permet en outre, pour des elements de types plus complexes, 
d'affiner la comparaison. 

Prenons l'exemple d'une classe A qui contient un attribut tit re. Trier les elements 
en fonction de cet attribut peut se faire en modifiant la fonction de comparaison. 

Fonction de comparaison de classes de type A 



>» def mon_tri(ell, el 2): 

if e!2.titre < el2.titre: 

return 1 
if e!2.titre > el2.titre: 

return -1 
return 
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Cette solution n'est cependant pas optimale et peut ralentir le code de maniere con- 
sequents. Pour accelerer les tris d'objets complexes, le code pattern le plus efficace 
consiste a utiliser la transformation de schwartzian : utiliser le tri interne de la classe 
list, en modifiant la liste pour que chaque element devienne un tuple, compose de 
l'attribut a trier puis de 1' element d'origine. 

Cet attribut extrait devient la cle de tri, et permet d'obtenir le meme resultat. 
Tri par extraction de de 

>» class A: 

def init (self, title): 

self. title = title 
def str (self) : 

return 'Film: %s ' % self. title 

>» Al = A('Qui veut la peau de mes 64 bits ?') 

>» A2 = A('Ali Baba et les 40 valeurs') 

>» A3 = A('Placer ici un titre de film plus drole que les precedents') 

»> mes_films = [Al, A2 , A3] 

>» tri_mes_films = [] 

>» for film in mes_films: 

... tri_mes_films.append((film. title, film)) 

>» tri_mes_films.sort() 

>» films_tries = [] 

>» for cle_de_tri, film in tri_mes_films : 

... films_tries .append(film) 

>» for film in films_tries: 
print str(film) 

Film: Al i Baba et les 40 valeurs 

Film: Placer ici un titre de film plus drole que les precedents 

Film: Qui veut la peau de mes 64 bits ? 

On peut generaliser le code pattern en proposant une fonction de tri inplace, qui 
prend en parametres la sequence et l'attribut a utiliser. 

Code pattern de tri inplace d'objets 

>» def tri_liste(liste, attribut): 

... liste[:] = [(getattr(elem, attribut), elem) for elem in liste] 

liste. sort() 
... liste[:] = [elem for cle, elem in liste] 
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La notation 1 i ste [ : ] permet d'affecter des elements a un objet liste sans avoir a 
recreer d'objet, afin d'obtenir un tri inplace. 

Ce code pattern, valable pour toutes les versions de Python, peut etre adapte pour 
trier des sequences entre elles, en fournissant par exemple un entier qui determine la 
position de la valeur a utiliser comme cle de tri. 

Concatener des chaines 

Une operation tres frequente en Python consiste a concatener des chaines de carac- 
teres. La raison en est relativement simple : les objets de type string etant des 
sequences immuables, il est necessaire de recreer un objet lorsque Ton souhaite modi- 
fier des elements de la chaine. 

La premiere idee qui vienne a l'esprit lorsque Ton concatene des chaines est de bou- 
cler sur les elements pour les mettre bout a bout. 

Concatenation 

>» chaine = ' ' 
>» for i in range(lO): 
chaine += str(i) 

>» chaine 
'0123456789' 

Avant la version 2.4 de Python, ce genre d'ecriture etait catastrophique, car chaque 
iteration entrainait une creation d'un nouvel objet string en memoire. 

Le code pattern le plus communement adopte etait d'utiliser un objet liste pour la 
preparation des elements a concatener, puis d'appeler la methode join() d'un objet 
string vide. 

Concatenation par join() 

>» chaine = [str(i) for i in range (10)] 
>» chaine = ' ' . join(chaine) 
>» chaine 
'0123456789' 

Cette methode reste valable pour les versions de Python inferieures a la 2.4 mais est a 
present obsolete, voire legerement plus lente qu'une concatenation classique si une 
list comprehension n'est pas utilisee : le code interne de Python a ete modifie pour ne 
plus creer d'objets intermediaires lorsque des chaines sont concatenees. 
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La meme remarque est valable pour les chaines formatees : la technique n'apporte 
plus de gain de vitesse. II est cependant conseille de conserver l'ecriture formatee, 
beaucoup plus risible, voire d'adopter dans certains cas une ecriture encore plus expli- 
cite, basee sur la substitution des elements par dictionnaire. 

Formatage 

>» nom = 'bob' 

>» phrase = 'bonjour ' + nom + ' comment va ?' 

>» phrase 

'bonjour bob comment va ?' 

>» phrase = 'bonjour %s comment va ?' % nom# ecriture a preferer 

>» phrase 

'bonjour bob comment va ?' 

>» elements = {'nom': 'bob'} 

>» phrase = 'bonjour %(nom)s comment va ?' % elements # plus explicite 

'bonjour bob comment va ?' 

Remplacer certains tests par une gestion d'exception 

Lorsqu'un test couteux doit etre mis en place dans une boucle pour gerer un cas raris- 
sime, il est interessant lorsque c'est realisable, de passer la gestion de ce cas en excep- 
tion. On evite ainsi un appel systematique au test. 

Gestion d'un cas par exception 

>» def funclO : 
res = 

elements = [i for i in range(lOOOOO)] 
elements .append(None) 
elements . append ('og') 
for element in elements: 

if element isnot None and isinstance(element , int): 
res += element 
return res 

def func2(): 
res = 

elements = [i for i in range(lOOOOO)] 
elements .append(None) 
elements . append ('og') 
for element in elements: 
try: 

res += element 
except TypeError: 
pass 
return res 
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>» timeit .Timer('funcl() ' , 

12.883871078491211 

>» timeit. Timer('func2() ' , 

7.4781858921051025 



'from main import fund') .timeit (100) 

'from main import func2 ') .timeit (100) 



Minimiser les appels et rapprocher le code 

D'un point de vue interpreteur, tout appel a une fonction ou une methode necessite 
de faire une recherche dans le contexte local et/ou global. Si cette fonction est un 

attribut d'un objet du contexte, une recherche dans l'attribut diet de l'objet en 

question est de plus necessaire, et ainsi de suite. 

Pour resumer, plus le code est eloigne et eparpille, plus son acces est couteux. 

Pour les hot spots, e'est-a-dire les portions de code a optimiser d'urgence, minimiser 
les acces a du code externe est un exercice tres rentable. Une des methodes consiste a 
regrouper des fonctions dans une seule et meme fonction, en agregeant si necessaire 
les donnees utilisees en un seul ensemble de parametres. 

L'exemple ci-dessous est le plus simple, mais le plus parlant : dans une fonction, une 
boucle appelle a chaque iteration une autre fonction. On repousse cette boucle dans 
la fonction, qui prend alors en charge la sequence d'elements au lieu de ne travailler 
que sur un seul element. On passe dans ce cas a un seul appel exterieur. 

Federation de code 

>» import timeit 

>» def versionl(element) : 

... return element .upper() 

>» def version2(elements) : 

... elements[:] = [element .upper() for element in elements] 

>» def code_appelantl() : 

... liste = ['azerty', 'qwerty' , ' peu importe'] 

... for i in range(5):# pour faire une liste + grosse 

... liste = liste + liste 

... return [versionl(phrase) for phrase in liste] 

>» def code_appelant2() : 

... liste = ['azerty', 'qwerty', 'peu importe'] 

... for i in range(5): # pour faire une liste + grosse 

... liste = liste + liste 

version2(liste) 

return liste 
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>» timeit .Timer('code_appelantl() ' , 'from main import 

code_appelantl') .time-it (100000) 
9.484644889831543 

>» timeit .Timer('code_appelant2() ' , 'from main import 

code_appelant2') .timeit (100000) 
6.5702319145202637 

Cette technique a cependant tendance a rendre le code de moins en moins lisible et 
de plus en plus difficile a maintenir et faire evoluer, car les fonctions agregees peu- 
vent devenir de gros blocs monolithiques illisibles. 

Une autre technique pour minimiser les appels sans modifier les fonctions appelees 
consiste a definir des variables locales qui pointent sur chacun des elements exterieurs. 

Variables locales de fonctions 

>» def funcl() : 

titres = ['qui veut la peau de mes 64 bits ?', 
'ali baba et les 40 valeurs', 
'placer ici un titre de film'] 
liste = [] 
for titre in titres: 

1 i ste . append (st r . ti tl e (ti t re) ) 
return liste 

def func2(): 

titres = ['qui veut la peau de mes 64 bits ?', 

'ali baba et les 40 valeurs', 

'placer ici un titre de film'] 
title = str. title 
liste = [] 

append = liste. append 
for titre in titres: 

append (title (tit re)) 
return liste 

>» import timeit 

>» o = timeit. Timer('funcl() ' , 'from main import fund') 

>» o.timeitO 
7.7832179069519043 

>» o = timeit. Timer('func2() ' , 'from main import func2') 

>» o.timeitO 
6.7249960899353027 

L'ecriture est encore une fois beaucoup moins explicite et ce genre de modification 
est a utiliser avec parcimonie. 
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Utiliser les list comprehensions 

Depuis la version 2.4 de Python, les list comprehensions sont de loin la forme la plus 
concise et la plus rapide pour manipuler des sequences. 

Comparaison de rapidite 

# -*- coding: utf8 -*- 
import time 

def transformee_classique(liste) : 
res = [] 
for x in liste: 

res.append(x + 1) 
return res 

def transformee_map(liste) : 

return mapOambda x: x+1, liste) 

def transformee_~lc("liste) : 

return [x+1 for x in liste] 

def duree(fonction, n=10000000) : 
debut = time.clockO 
foncti on ( range (n)) 
fin = time.clockO 
return fin - debut 

print "Transformee classique: %f" % duree(transformee_classique) 

print "Transformee par map(): %f" % duree(transformee_map) 

print "Transformee par list-comprehension: %f" % duree(transformee_lc) 

[...] 

$ python2.4 benchlc.py 
Transformee classique: 6.010000 
Transformee par map(): 5.340000 
Transformee par list-comprehension: 2.600000 

$ python2.3 benchlc.py 
Transformee classique: 8.580000 
Transformee par map(): 6.770000 

Transformee par list-comprehension: 6.430000 

On remarque egalement que 1'utilisation de map() n'est guere plus rapide que la 
forme eclatee pour la version 2.4, et devient de plus en plus obsolete. 
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Utiliser les generators et les genexp 

Les generators offrent une maniere elegante et performante de recuperer les resultats 
intermediates d'une fonction sans avoir a implementer un systeme de callback. 

Generator infini, suite de Fibonacci 

>» def fibonacci(): 
a, b = 0, 1 
while 1: 

yield b 

a, b = b, a+b 

>» fib = fibonacci'O 

>» [fib.nextO for val in range(lO)] 

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55] 

Cette mecanique peut etre mise en place dans tous les algorithmes de generation de 
sequences. 

Les generators expressions sont quant a eux l'equivalent des list comprehensions 
pour les iterators et permettent des gains de memoire. 

Genexp 

>» def gen(sequence) : 
... for element in sequence: 
yield element + 1 

>» genexp = gen([l, 2, 3, 4]) 

>» list(genexp) 

[2, 3, 4, 5] 

>» # ecriture equivalente en genexp 

>» genexp = (element + 1 for element in [1, 2, 3, 4]) 
>» list(genexp) 
[2, 3, 4, 5] 

Preferer les fonctions d'itertools 

itertools, module presente au chapitre 10, implemente des fonctions codees en C 
qui permettent de generer tres rapidement des iterators pouvant etre utilises pour 
remplacer certaines primitives, comme : 

* map() ; 

• filterO ; 

• reduceO ; 

* zipQ. 



Techniques avancees 

QUATRIEME PARTIE 



Caching 



Lorsqu'une fonction tres couteuse en temps est appelee plusieurs fois, il peut etre 
interessant de mettre en place un systeme de cache, qui conserve les resultats des cal- 
culs en memoire et les ressert en cas de besoin, afin d'eviter de les recalculer. 

Cette technique n'est bien sur applicable qu'aux fonctions dont les resultats restent 
invariants en fonction des parametres d'entree. 

Le module di rcache est un bon exemple de caching : pour fournir une liste des 
fichiers d'un repertoire donne, le parcours est relativement couteux, surtout si toute 
l'arborescence est demandee. 

Le contenu de chaque repertoire parcouru est conserve en memoire dans un diction- 
naire, et resservi a condition que la date de modification du repertoire au moment de 
la demande soit identique a celle conservee en memoire. Dans le cas inverse, le cache 
est mis a jour. 

Module dircache 



cache 



{} 



def reset() : 

"""Reset the cache completely.""" 
global cache 
cache = {} 

def listdir(path) : 

"""List directory contents, using cache. 
try: 

cached_mtime, list = cache [path] 

del cache [path] 
except KeyError: 

cached_mtime, list = -1, [] 
mtime = os.stat(path) . st_mtime 
if mtime != cached_mtime: 

list = os.listdi r(path) 

list. sort() 
cache [path] = mtime, list 
return list 



Si Ton generalise ce mecanisme, appele aussi memorizing, on obtient le code pattern 
suivant, qui collecte les resultats calcules, en fonction des parametres, en fabriquant 
une cle unique pour chaque combinaison. 
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Fonction avec cache 

import md5 

cache = {} 

def ca~lcu~l_savant(*args) : 
key = str(args) 
try: 

res = cache[key] 
except Key Error: 

res = md5.md5() .hexdigestO 

cache [key] = res 
return res 

II est possible de rendre ce fonctionnement totalement generique en concevant un 
decorator, applicable a toute fonction puisqu'il externalise le mecanisme de caching. 

decorator memoize 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

import md5 

def memoize (func) : 
cache = {} 
def call (*args) : 
try: 

return cache [args] 
except KeyError: 

res = func(*args) 
cache[args] = res 
return res 
except TypeError: 

# parametre unashab]e 
return func(-'args) 
call .func_name = func.func_name 
return call 

©memoize 

def ca]cu]_savant(' v args) : 

key = str(args) 

return md5.md5(key) .hexdigestO 

Cette mecanique ne reste efficace que si le nombre de combinaisons de parametres 
en entree reste relativement faible et si les resultats de la fonction ne dependent pas 
d'autres facteurs externes. 
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De plus, si les resultats renvoyes sont des elements prenant une certaine place en 
memoire, il faut s' assurer que le mecanisme de caching, qui se charge d'ecrire mais 
aussi de recuperer les valeurs, ne coute pas plus cher que le calcul lui-meme. 

Enfin, si la memoire occupee par le cache devient trop importante, et si les condi- 
tions le permettent, il peut etre interessant d'externaliser le stockage du cache vers un 
serveur specialise dans la gestion de cache memoire distribue. 

Le serveur Open Source memcached (http://www.danga.com/memcached/) repond rela- 
tivement bien a ce besoin. 

Multithreading 

Le multithreading consiste a detacher l'execution d'une tache de l'execution principale 
lorsque la suite immediate du programme n'est pas dependante des resultats. La tache 
est executee dans un nouveau thread et le programme devient le thread principal. 

Cette situation se rencontre : 

• Dans les applications interactives, lorsqu'une commande lance une tache et ren- 
voie la main immediatement a l'utilisateur, qui peut continuer a utiliser le pro- 
gramme en attendant les resultats. 

• Dans les programmes de type serveur, ou chaque demande client est geree dans 
un nouveau thread. Par exemple, un serveur FTP detache une session avec un 
client dans un thread afin de rester disponible pour d'autres demandes. 

• Dans les applications ou Ton souhaite decoupler la production et 1'utilisation de 
donnees, ces donnees pouvant etre produites par une source externe non maitrisee. 
C'est le cas par exemple de programmes de telechargement comme BitTorrent. 

• etc. 



Culture Quelques definitions courtes 

Un thread est associe par le systeme a un unique processus, qui represents le programme en cours d'exe- 
cution en memoire. II peut executer du code comme un processus. 

Un processus peut posseder un nombre indefini de threads. Un thread est different d'un processus, car il 
partage, avec tous les threads issus du meme processus, le meme espace memoire. On parle de ressour- 
ces partagees. 



Ressources partagees : difficultes de programmation 

Les threads partagent le meme espace memoire, il est done necessaire de prendre des 
precautions lorsqu'ils utilisent les memes elements. 
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En effet, si un thread modifie une ressource, il doit en proteger Faeces par d'autres 
threads jusqu'a la fin de son travail. Ces points de synchronisation ou sections critiques 
evitent des effets de bords non maitrises en garantissant l'integrite des ressources. 

D'un point de vue developpement, le travail consiste a rendre le code thread-safe, 
e'est-a-dire a proteger toutes les parcelles de code qui modifient des donnees pouvant 
etre lues et utilisees par d'autres parcelles de code, en utilisant des lockers, veritables 
verrous programmatiques. 

La sequence protegee est done : 

1 lock : enclenchement du verrou ; 

2 travail : code protege ; 

3 unlock : liberation du verrou. 

Lorsqu'un thread A atteint l'etape 1, il verrouille les ressources auxquelles il va 
acceder et s' assure ainsi que l'etape 2 ne peut pas etre executee par un autre thread en 
meme temps. 

A la fin du travail, le thread A deverrouille les ressources. Si un deuxieme thread B 
atteint l'etape 1 pendant que le thread A est encore dans l'etape 2, il est bloque et doit 
attendre que le verrou soit libere avant de pouvoir a son tour verrouiller les ressources. 

Cette technique parait relativement simple de prime abord mais entraine des diffi- 
cultes de programmation : 

• Si le thread A (ou tout autre thread si cette etape est deleguee) ne passe jamais par 
l'etape 3, par une exception mal geree par exemple, le thread B reste bloque a tout 
jamais. On parle dans ce cas d'un deadlock. 

• Si le thread A, dans le code protege, verrouille a nouveau les ressources, il se blo- 
que lui-meme par deux appels successifs a "lock. 

Le deuxieme cas peut etre gere grace a des verrous particuliers : les locks reentrants, 
qui ne bloquent pas un thread qui tente de verrouiller a nouveau les memes res- 
sources. Le deverrouillage doit cependant etre fait par ce meme thread. 

Le premier probleme reste entier et necessite de bien controler le code protege. 

En termes de performances, il est aussi important de ne proteger que le strict neces- 
saire pour eviter des latences dues a des verrous sur des portions de code trop larges. 

Une derniere technique de coordination consiste a faire communiquer les threads 
entre eux pour qu'ils puissent travailler de maniere concertee. 

Typiquement, un thread attend qu'un signal soit ends pour commencer ou continuer 
son travail, ce signal etant emit par un autre thread. 
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Le module threading 

Python fournit un module de haut niveau nomme threading, qui masque toute la 
complexite de mise en oeuvre des threads pour fournir : 

• une classe Thread pour executer du code dans un nouveau thread ; 

• des utilitaires de protection des ressources partagees ; 

• une classe Event qui permet aux threads de communiquer entre eux. 

La classe Thread permet d'executer du code dans un nouveau thread, en passant une 
fonction ou une methode a la construction de l'instance, ou en derivant la classe pour 
implementer le code de la methode run(). C'est cette methode qui est executee dans 
un thread separe. 

class Thread(group=None, target=None, name=None, args=(), kwargs={}) 

Le parametre group ha aucune utilite actuellement et a ete introduit pour une future 
implementation des groupes de threads, target definit une fonction ou methode qui 
est appelee par la methode run(). name determine le nom du thread, qui peut etre 
ensuite lu par la methode getname(). Ce nom ha pas d'utilite fonctionnelle mais 
peut permettre dans certains cas de differencier simplement plusieurs threads. Enfin, 
args et kwargs sont les parametres passes a target si necessaire. 

start() 

Appelee une seule fois, start () permet de lancer un nouveau thread et d'y executer 
la methode run(). 

run() 

Methode executee dans le thread. Si target a ete fourni, run() l'execute. Dans le cas 
inverse, cette methode peut etre surchargee pour contenir directement le code a executer. 

Le thread est alive des que cette methode est appelee. Lorsque run() est termine, 
soit par la fin de 1' execution, soit par une levee d'exception, le thread est dead. 

join([timeout]) 

Attend que le thread se termine. Cette methode peut etre appelee par un autre 
thread qui se met alors en attente de la fin d'execution du thread. Si timeout est 
fourni, c'est un reel qui determine en secondes le temps d'attente maximum. Passe ce 
delai, le thread mis en attente est debloque. 

isAliveO 

Informe sur l'etat du thread. Renvoie True si la methode run() est en cours d'execution. 
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L'exemple ci-dessous execute une fonction dans un thread separe et laisse le thread 
principal libre. Ce dernier en l'occurrence attend que le thread annexe s'acheve, en 
affichant des caracteres sur la sortie standard. 

Exemple 1 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

from threading import Thread 

from time import sleep 

from sys import stdout 

def visiteurO : 

print("C'est Andre, je monte !") 

sleep(5) 

print('\ntoc toe toe') 

if name == ' main ' : 

print("Drrrrrrring") 

sleep(l) 

print('Oui ?') 

sleep(l) 

thread = Thread(target=visiteur) 

thread. start() 

sleep(l) 

print('OK, depeche toi') 

i = 

while thread. isAlive() : 
if i ==0: 

stdout. write('z') 
i = 1 
else: 

stdout. write('Z') 
i = 

stdout. flush() 
sleep(0.4) 

print("Ah, te voila ! D'ai bien failli attendre !") 

$ python threaded. py 

Drrrrrrring 

Oui ? 

C'est Andre, je monte ! 
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OK, depeche ton 

zZzZzZzZzZz 

toe toe toe 

Ah, te voila ! J'ai bien failli attend re ! 

Lorsque le code est plus complexe qu'une simple fonction, il peut etre judicieux de le 
regrouper dans une classe derivee de Thread et de surcharger run() et si necessaire 
_init_0. 

Dans le cas d'un nouveau constructeur, le constructeur original doit absolument etre 
appele afin d'assurer l'initialisation de la mecanique interne. 

Exemple 2 

#! /usr/bi n/python 

# -*- coding: utf8 -*- 

from threading import Thread 

from time import sleep 

from sys import stdout 

class Ingenieur(Thread) : 

def init (self, resultats): 

Th read . i ni t (sel f ) 

self ._resultats = resultats 

def run(self) : 

""" calcul relativement complexe """ 

sleep(5) 

self ._resultats .extend([' je' , 'sais', 'pas']) 

if name == ' main ': 

resultats = [] 

bob = Ingenieur(resultats) 

bob.startO 

print('Bob est en train de fai re les calcul s') 

for i in reversed(range(5)) : 

stdout. write('%s '% str(i)) 

stdout .flush() 

sleep(l) 
bob. join() 

print('\nvoici Bob') 
print('Bob: %s' % ' ' . join(resultats)) 

$ python threaded. py 
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Bob est en train de fan re les calculs 

4 3 2 10 

voici Bob 

Bob: je sais pas 

Lorsque plusieurs threads se partagent des ressources, il est necessaire de proteger le 
code par des points de synchronisation. Le module thread fournit des fonctions de 
creation de verrous, encapsulees par deux objets de threadi ng : Lock et Rl ock. 

class Lock() 

Cree une nouvelle primitive de synchronisation. Deux methodes sont ensuite 
accessibles : acquireO et releaseO- 

acquire([blocking=l]) 

Acquiert le verrou et renvoie True en cas de succes. Si blocki ng est a 1 ou n'est pas 
specifie, l'appel de cette methode bloque le thread si le verrou est deja locke par un 
autre thread. Si blocking est a 0, acquireO se contente de renvoyer False pour 
signaler que le verrou est deja pris. 

releaseO 

Libere le verrou, autorisant d'autres threads a le reprendre. Si plusieurs threads sont 
en attente de ce verrou, un seul thread est autorise a l'acquerir. Appeler cette 
methode sur un verrou qui n'est pas ferme leve une exception. 

La classe Rlock est identique mais permet au thread qui a le verrou de rappeler la 
methode acquireO sans provoquer de deadlock. Cette variation simplifie grande- 
ment la conception du code, surtout lorsque des fonctions recursives entrent en jeu. 
Rl ock est un lock reentrant. 

Lexemple ci-dessous definit une liste globale manipulee par plusieurs instances du 
thread Manipe. La suppression et l'ajout d'elements dans la liste doivent se faire de 
maniere protegee. 

Un verrou est done associe a la liste et le code du thread l'utilise pour proteger la 
modification de la liste. Un bloc try. .finally permet de s' assurer que le verrou est 
toujours libere. 

Implementation d'une section critique 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

from threading import Thread, Lock 

from time import sleep 

from sys import stdout 
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threads = [] 
locker = Lock() 

1-iste = ['a', 'b', 'c'] 

class Manipe (Thread) : 

def _manip(self) : 

for i in range(5) : 
locker. acqui re() 
try: 

liste. remove('a') 
sleep(O.l) 

liste. insert(0, 'a') 
finally: 

locker. releaseO 

def run(self) : 

threads. append (id (self)) 
try: 

self ._manip() 
finally: 

threads. remove(id(self)) 

if name == ' main ': 

for i in range(lO) : 
Manipe() .start() 

sleep(0.5) 

while len(threads) > 0: 
stdout.writeC . ') 
stdout .flush() 
sleep(O.l) 

stdout. write('\n') 
$ python threaded. py 



Si la gestion du verrou est mise en commentaire et le code relance, 1' execution se 
passe tres mal, car chaque thread manipule la liste en partant du postulat quelle con- 
tient l'element a. Cet element pouvant etre supprime par un autre thread, des erreurs 
apparaissent. 
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Retrait du verrou 



def _manip(self) : 

for i in range(5) : 
#locker .acqui re() 
try: 

liste. remove('a') 

sleep(O.l) 

liste. insert(0, 'a') 
finally: 
pass 

#locker . release() 

$ python threaded. py 
Exception in thread Thread-2: 
Traceback (most recent call last): 

File "/usr/lib/python2 .4/threading.py" , line 442, in bootstrap 

self. run() 
File "threaded. py" , line 28, in run 

self ._manip() 
File "threaded. py" , line 18, in _manip 
liste. remove('a') 
ValueError: list . remove (x) : x notin list 

Exception in thread Thread-3: 
Traceback (most recent call last): 

File "/usr/lib/python2 .4/threading.py" , line 442, in bootstrap 

self. run() 
File "threaded. py" , line 28, in run 

self ._manip() 
File "threaded. py" , line 18, in _manip 
liste. remove('a') 

Outre les sections critiques, il existe un autre mecanisme qui permet de coordonner 
le travail de plusieurs threads : les evenements definis par des objets de type Event. 

class Event() 

Renvoie une instance de type Event, qui peut etre considered comme un drapeau. 
Cette classe fournit des methodes pour determiner l'etat du drapeau. Les threads 
peuvent manipuler ces objets pour se coordonner. L'etat interne du drapeau est a 
Fal se lorsque l'objet est instancie. 
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isSetO 

Renvoie l'etat du drapeau. 

sct() 

Passe le drapeau a True. Tous les threads en attente de l'evenement sont debloques. 

clearO 

Passe le drapeau a Fal se. Tous les threads qui attendent 1' evenement seront bloques. 

wait([timeout]) 

Permet d'attendre revenement. Si le drapeau est a True, renvoie la main immediate- 
ment. 

ti meout permet de specifier un temps en secondes apres lequel le thread en attente 
est debloque meme si l'evenement ha pas eu lieu. Lorsqu'il n'est pas specifie, le 
thread est bloque indefiniment. 

La classe Event permet de mettre en ceuvre des schemas complexes d'interactions de 
threads, ou chaque intervenant se reveille sur un evenement particulier, execute du 
code et provoque a son tour un evenement, avant de se terminer, ou d'attendre a 
nouveau un evenement. 

L'exemple ci-dessous imite une course de relais 4 x 100 metres ou chaque athlete est 
represente par un thread. L'athlete se met a courir lorsque le precedent a termine sa 
distance. Cet evenement est represente par trois objets 100_metres, 200_metres, 
300_metres. 

Tous les threads sont lances au debut du programme, mais les 3 derniers attendent 
leurs evenements respectifs pour declencher leurs courses. 

Course 4 x 100 metres 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

from threading import Thread, Event 

from time import sleep 

from sys import stdout 

_100_metres = EventO 
_200_metres = EventO 
_300_metres = EventO 

class Coureurl(Thread) : 
def run(self) : 

for i in range (10) : 
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stdout.wri te(' . ') 
stdout.flushO 
sleep(0.2) 
stdout . wri te ( ' 100M ' ) 
_100_metres.set() 

class Coureur2(Thread) : 
def run(self) : 

_100_met res . wan t () 
for i in range (10) : 
stdout. write(' . ') 
stdout.flushO 
sleep(0.2) 
stdout. write('200M') 
_200_metres.set() 

class Coureur3(Thread) : 
def run(self) : 

_200_metres .wait() 
for i in range (10) : 
stdout. write(' . ') 
stdout.flushO 
sleep(0.2) 
stdout. write('300M') 
_300_metres.set() 

class Coureur4(Thread) : 
def run(self) : 

_300_met res . wan t () 
for i in range (10) : 
stdout. write(' . ') 
stdout.flushO 
sleep(0.2) 
print('400M') 

if name == ' main ' : 

c4 = Coureur4() 

c4.start() 

Coureur3() .start() 

Coureur2() .start() 

CoureurlO .start() 

# attente du dernier coureur 

c4. join() 



Les evenements et les threads permettent de modeliser des problemes complexes 
d'interaction. 
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Un cas recurrent, et beaucoup plus simple, d'echanges entre threads est presente dans 
la section suivante, mais avant d'aller la lire, merci de laisser nos coureurs faire leur 
course, ils attendent depuis quelque temps... 

La course, enfin 

[tziade@Tarek Documents] $ python course. py 

100M 200M 300M 400M 

Le module Queue 

Ce module implemente une queue FIFO (first in first out) dans laquelle des donnees 
peuvent etres ajoutees et recuperees. First in first out signifie que la premiere donnee 
ajoutee est la premiere recuperee, a l'image d'un tuyau, en opposition aux piles LIFO 
(last in first out) ou le dernier element ajoute est le premier a etre servi, a l'image 
d'une pile de dossiers. 

Cette classe convient bien a l'echange de donnees entre threads car elle est 
thread-safe. Les threads qui remplissent la pile sont nommes Producteurs et ceux qui 
recuperent les donnees Consommateurs. 

class Queue(maxsize) 

Un objet Queue doit etre construit avec le parametre maxsize qui determine la taille 
de la pile. Lorsque la pile est pleine, il n'est plus possible d'y ajouter des elements. Si 
maxsi ze est a ou negatif, la pile est de taille infinie. 

put(item[, block[, timeout]]) 

Ajoute l'element i tern dans la pile. L'appel a cette methode devient bloquant lorsque 
la pile est pleine : put() rend alors la main des que l'element a pu etre ajoute. block 
peut etre defini a Fal se. Dans ce cas si la pile est pleine, put() leve une exception de 
type Full. 

put_nowait(item) 

Raccourci pour la notation put (item, block=False). 

get([block[, timeout]]) 

Renvoie le premier element insere et l'enleve de la pile, block, a defaut a True, met 
en attente le code si la pile est vide, avec un timeout en secondes optionnel. Si block 
est force a Fal se, et si la pile est vide, une exception Empty est levee. 

get_nowait() 

Raccourci pour la notation get(block=False). 
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qsizeO 

Renvoie la taille actuelle de la pile. 

emptyO 

Renvoie True si la pile est vide. 

full() 

Renvoie True si la pile est pleine. 

Classiquement, un objet Queue est utilise lorsque le Producteur de donnees nest pas mai- 
trise et que le programme doit se mettre en attente de ces donnees pour pouvoir lancer un 
traitement. Un exemple complet est implemente dans l'exercice 8 du chapitre 11. 

Le Global Interpreter Lock et multiprocessing 

Le code meme de l'interpreteur Python n'est pas thread-safe et un lock general existe 
pour empecher plusieurs threads de modifier des registres en meme temps. II s'agit 
du Global Interpreter Lock, ou GIL. 

A cause du GIL, les threads ne sont pas reellement capables de fonctionner totale- 
ment en parallele, sauf lorsqu'ils utilisent du code C ou qu'ils appellent des pro- 
grammes externes. 

Les performances de la programmation par threads en Python sont done tees limi- 
tees, et les programmes ne sauront pas tirer parti d'une architecture multi-processus. 
Cette limitation se ressent par exemple dans les serveurs d'applications codes en 
Python qui tournent sur un serveur multi-processeur : ils utilisent 100 % d'un pro- 
cesseur a forte charge et ne tirent pas partie du deuxieme. Malgre les differents tra- 
vaux de membres de la communaute pour supprimer le GIL, l'implementation 
actuelle de CPython ne changera pas car une recriture importante est a envisager. 

La solution la plus simple pour contourner ce probleme est d'utiliser des processus au 
lieu de threads. C'est ce qu'offre le module multiprocessing. Ce module, introduit 
dans Python 2.6, mais egalement backporte dans Python 2.4 et 2.5, permet de mani- 
puler des processus avec des fonctions et des classes similaires. 

La methode la plus souple consiste a utiliser la classe Pool fournie par le module pour 
y placer des travaux independants a realiser. multiprocessing gere alors la creation 
des processus, leur gestion et la recuperation des resultats de maniere totalement 
transparente. 
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Utilisation de multiprocessing.Pool 

>» from multiprocessing import Pool 
>» def async (value) : 

return value * 2 

>» pool = Pool () 

>» result = pool .apply_async (async, [10]) 

>» result .get(timeout=5) 

20 

Dans l'exemple ci-dessus, un appel a async (10) est effectue dans un nouveau pro- 
cessus par un appel a apply_async. Le resultat qu'il retourne est un objet interme- 
diaire de type ApplyAsync. Cet objet possede une methode get qui se met en attente 
du resultat et le renvoie. Le parametre ti meout permet de rendre la main si le pro- 
cessus n'a pas fini au bout de 5 secondes. 

Le cote obscur de la force : extension du langage 

Caching, threading, rien n'y fait, aucune de ces methodes ne permet de rendre le 
code suffisamment rapide. Les performances ne sont tout simplement pas au 
rendez-vous. II reste une (presque) derniere alternative pour optimiser le code : coder 
une extension a Python dans un autre langage de programmation, en l'occurrence 
en C puisqu'il est a la base de Python, comme la plupart des langages modernes. 

II existe deux cas de figure pour concevoir un module d'extension : 

• Une bibliotheque est deja disponible en C, et l'exercice consiste a mettre en place 
un pont entre Python et cette bibliotheque : un binding. 

• Le module en C doit etre concu, puis lie comme dans le premier cas. 

Mais avant d'aborder ces sujets, il est necessaire de mettre en place un environne- 
ment de compilation. 

Environnement de compilation 

Pour etendre Python, il est necessaire de pouvoir compiler le code C. Cette opera- 
tion ne pose aucun probleme sur les plates-formes GNU/Linux ou Mac OS X, ou il 
suffit d'installer le compilateur standard gcc (http://gcc.gnu.org/), lorsqu'il n'est pas 
deja installe. 

Sous MS-Windows, deux options s'offrent a vous : 

• installer MVC++ {Microsoft Visual C++ Developer Studio), sachant qu'il existe une 
version Express gratuite, suffisante pour les besoins de compilation ; 

• installer l'alternative libre : MingGW(http://www.mingw.org). 
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Pour pouvoir utiliser MingGW dans la phase de compilation, il est necessaire : 

• d'ajouter le repertoire bi n de Installation de MinGW au PATH ; 

• de copier le fichier Python2x . dl 1 dans le repertoire 1 i b de MinGW ; 

• d'ajouter un fichier distutils.cfg dans C:\python2x\lib\distutils\ avec ce 
contenu decrit ci-dessous. 

Fichier distutils.cfg 

[build] 

compi 1 er=mi ngw32 

On obtient alors un environnement de compilation similaire a celui obtenu avec 
MVC++. 



A SAVOIR Verification sous GNU/Linux 

Si vous avez installe Python sous GNU/Linux avec des binaires, vous devez vous assurer que le paquet 
python2 . x-dev est installe. 



Binding de bibliotheque 

Pour utiliser des bibliotheques d'extensions il existe deux techniques : 

• utiliser l'outil SWIG ; 

• utiliser le module standard ctypes. 

SWIG 

L'outil SWIG {Simplified Wrapper Interface Generator) (http://www.swig.org/) permet 
de connecter un programme C ou C++ a plusieurs autres langages (Perl, Python, Tel, 
Guile, Ruby, PHP, Objective Caml, Modula-3, C#, etc.). 

Pour qu'un programme C ou C++ soit utilisable par SWIG, il est necessaire de creer 
un fichier interface, qui publie les elements a lier. Ce fichier est utilise pour generer le 
module d'extension. 

Prenons l'exemple du module exemple.c ci-dessous (issu de l'aide en ligne de 
SWIG). 

Module exemple.c 

#include <time.h> 

double My_variable = 3.0; 
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int fact(int n) 
{ 

if (n <= 1) 
return 1; 
else 

return n*fact(n-l); 
} 

int my_mod(int x, int y) 

{ 

return (x%y) ; 

} 

char *get_time() 
{ 

time_t ltime; 

time(&ltime) ; 

return cti me (&1 ti me) ; 
} 

Le fichier d'interface correspondant publie les elements du module C, par une syn- 
taxe declarative particuliere. 

Module d'interface exemple.i 

/* exampl e . i */ 

%module exemple 

%{ 

extern double My_variable; 

extern int fact(int n) ; 

extern int my_mod(int x, int y); 

extern char *get_time(); 

%} 

extern double My_variable; 
extern int fact(int n) ; 
extern int my_mod(int x, int y); 
extern char *get_time(); 

La commande swig -python exemple.i lance la lecture du fichier interface, et 
genere un fichier exempl e_wrap . c qui contient les API de SWIG et le code modifie. 

^installation de ce module comme extension se fait par le biais du module 
distutils.core, qui compile le programme C exempl e_wrap.c, et le place dans le 
repertoire site-packages de Python pour le rendre disponible. 

On retiendra deux elements de di stuti 1 s . core : 

• la fonction setup(arguments), qui permet de compiler et installer des modules 
d'extension ; 
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• la classe Extension, qui decrit un module d'extension C ou C++. 

La fonction setup () prend en parametres un certain nombre d'options, dont : 

• name : un objet string representant le nom du module ; 

• versi on : un objet string contenant un numero de version pour le module ; 

• extjnodules : une liste d'objets de type Extension, a construire ; 

• mai ntai ner : le nom du developpeur en charge du module ; 

• mai ntai ner_email : son e-mail ; 

• description : une description courte, sous la forme d'une ligne de texte ; 

• long_description : une description plus detaillee. 
La classe Extension est construite quant a elle avec : 

• name : le nom du module d'extension ; 

• sources : la liste des fichiers sources C, C++ ; 

• i ncl ude_di rs : la liste des repertoires contenant des en-tetes C, C++ a inclure a 
la compilation. Le repertoire contenant Python. h est automatiquement ajoute et 
ce parametre n'est a utiliser que pour aj outer de nouvelles dependances ; 

• library_di rs : la liste des repertoires contenant des bibliotheques a inclure a la 
liaison, si necessaire. 

Creer un fichier d'installation consiste done a coder un fichier Python contenant un 
appel a setupO . Par convention, ce fichier est nomme setup, py. 

Dans notre exemple, les fichiers necessaires a la compilation de 1' extension sont 
exempl e . c et exempl e_wrap . c. 

Fichier setup.py 

from distutils.core import setup 

from distuti Is. extension import Extension 

extension = Extension(name='_exemple' , 

sou rces= [ ' exempl e . c ' , ' exempl e_wrap . c ' ] ) 

setup(name="_exemple" , ext_modules=[extension]) 

Le code genere par SWIG prefixe le nom du module par le caractere _ et il est neces- 
saire d'en tenir compte dans la creation de setup . py. 

Ce module est ensuite invoque en ligne de commande, avec l'option build pour 
compiler le module d'extension, et i nstal 1 pour le placer dans l'interpreteur. 
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Compilation sous Linux 

$ python setup. py build 

running build 

running build_ext 

building '_exemple' extension 

creating build 

creati ng bui 1 d/temp . 1 i nux-i 686-2 . 4 

gcc -pthread -fno-strict-aliasing -DNDEBUG -02 -fomit-f rame-pointer 

-pipe -march=i 586 -mtune=pentiumpro -g -fPIC -I/usr/include/python2 .6 -c 

exemple.c -o bui 1 d/temp. li nux-i 686-2 .4/exemple.o 

exemple.c:22 :2 : warning: no newline at end of file 

gcc -pthread -fno-strict-aliasing -DNDEBUG -02 -fomit-f rame-pointer 

-pipe -march=i 586 -mtune=pentiumpro -g -fPIC -I/usr/include/python2 .6 -c 

exemple_wrap.c -o bui 1 d/temp. li nux-i 686-2 .4/exemple_wrap.o 

creati ng bui 1 d/1 i b . 1 i nux-i 686-2 . 4 

gcc -pthread -shared build/temp. linux-i686-2. 4/exemple.o build/ 

temp . 1 i nux-i 686-2 . 4/exempl e_wrap . o -o bui 1 d/1 i b . 1 i nux-i 686-2 . 4/ 

_exemple.so 

Cet appel cree un sous-repertoire build contenant une arborescence de plusieurs 
repertoires. On retrouve un fichier compile _exempl e . so, pret a etre installe par un 
appel a install. Sous MS-Windows, un fichier _exemple.dll est cree en lieu et 
place de exempl e . so. 

Installation de I'extension 



$ su 

Password: 

# python setup. py install 

running install 

running build 

running build_ext 

running install_lib 

copyi ng bui 1 d/1 i b . 1 i nux-i 686-2 . 4/_exempl e . so 

site-packages 



/usr/lib/python2 .6/ 



II est en general necessaire de passer en super-utilisateur pour cette etape, afin d'avoir 
acces en ecriture au repertoire site-packages de Python. 

Le module est a present installe et utilisable dans Python. 

Essais de I'extension exemple 

>» import exemple 
>» dir (exemple) 
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[' builtins ', ' doc ', ' file ', ' name ', '_exemple', 

'_newclass', '_object' , ' _swig_getattr ' , '_swig_setattr' , 

'_swig_setattr_nondynamic' , 'cvar', 'fact', 'get_time' , 'my_mod'] 

>» exemple.get_time() 

'Sun Sep 25 10:24:14 2005\n' 

>» exemple.fact(67) 





A SAVOIR Construction locale d'une extension 

II est possible de construire I'extension localement pour proceder a des essais avant une installation dans 
Python, en utilisant la commande python setup. py build_ext -inplace a la place 
d'i nstal 1 . Dans ce cas, le module est accessible lorsque le repertoire de compilation est dans les che- 
mins de recherche de I'interpreteur Python. 



Utilisation de ctypes 

Pour du code deja compile, ctypes permet de l'utiliser directement depuis Python en 
le chargeant dynamiquement. II n'y a plus besoin dans ce cas d'ecrire une extension. 

Dans l'exemple ci-dessous, la bibliotheque "libc est utilisee directement via ctypes. 

Utilisation de libc via ctypes 

>» import ctypes 

>» libc = ctypes. CDLL("li be. dylib") 

>» libc. printf ("Ecriture dans la sortie standard via libc\n") 

Ecriture dans la sortie standard via libc 

Creation d'un module d'extension 

La creation d'une extension pour Python se realise en deux etapes : 

• creation d'un module en C, en respectant un modele fourni par les API C de 
Python ; 

• installation du module comme extension de Python, par le biais du module 
distutils. 

Pour notre exemple, le module C met en oeuvre une fonction banale max(), qui prend en 
parametres deux entiers et renvoie le plus grand. Cette fonction ne sera pas plus rapide 
que son equivalent en Python mais est parfaite pour un exemple d'extension simple. 

Pour mettre en oeuvre max() cote C, il est necessaire : 

• de garnir la fonction pour la rendre comprehensible par I'interpreteur ; 

• de definir une table de methodes qui publie la fonction pour la rendre accessible a 
I'interpreteur ; 

• d'initialiser I'interpreteur pour qu'il prenne en charge le module d'extension. 
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Garniture de la fonction 

Le code C d'une telle fonction pourrait etre : 

Fonction max en C 

static int max(int a, int b) 
{ 

int resultat; 
if (a > b) 

resultat = a; 
else 

resultat = b; 

return resultat; 



} 

Integrer cette fonction comme extension Python necessite de modifier les parametres 
d'entree et de sortie pour qu'ils deviennent utilisables par l'interpreteur. En effet, 
l'interpreteur invoque toutes les fonctions C sur le meme modele d'appel generique, 
en passant les parametres dans des objets et en recuperant le resultat dans un objet. 

Ces objets sont definis dans le fichier d'en-tete Python. h, qui est installe en meme 
temps que Python sur le systeme, et qui contient egalement des fonctions et struc- 
tures annexes. 

On retiendra pour transformer notre fonction C trois elements : 

• PyObject : classe de base de tout objet manipule par l'interpreteur ; 

• PyArg_ParseTuple : fonction permettant la lecture des parametres passes a la 
fonction par l'interpreteur ; 

• Py_BuildValue : fonction permettant de construire un objet resultat en sortie de 
methode, qui sera recupere par l'interpreteur. 

Fonction max modifiee 

static PyObject *max(PyObject *self, PyObject *args) 
{ 

int a; 

"int b; 
int resultat; 



// recuperation des parametres 
if (! PyArg_ParseTuple(args, "ii 1 
return NULL; 

// le code C 
if (a > b) 

resultat = a; 



&a, &b)) 
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} 



else 

resultat = b; 

// construction d'un objet de type int renvoye a Python 
return Py_BuildVa"lue("i " , resultat); 



L'objet pointe par args correspond aux parametres arbitraires passes a la fonction au 
moment de son appel et contient un tableau de valeurs. Pour recuperer ces valeurs 
cote C, il est necessaire d'employer la fonction PyArg_ParseTuple qui alimente des 
variables en fonction de args et d'un format de lecture. Chaque reference de variable 
cible est fournie en parametre supplemental au moment de 1' appel. 

Le formatage est defini par une chaine de caracteres dont chaque element decrit le 
type de transformation a operer, d'un type Python a un type C. Les elements peuvent 
prendre les valeurs decrites dans le tableau suivant (liste non exhaustive). 

Tableau 13-1 Formatage des parametres 



Format Type Python Type C en sortie Commentaires 
en entree 


s 


string ou Unicode const char* La chame C est terminee par NULL. 


s# 


string ou Unicode 


const char-', int 


La chame C n'est pas terminee par NULL. Le 
deuxieme element contient la longueur de la 
chame. 


z 


string ou Unicode 
ou None 


const char* 


Comme s mais si None est passe renvoie un 
pointeursur NULL 


z# 


string ou Unicode 
ou None 


const char* 


Comme s# mais si None est passe renvoie un 
pointeursur NULL 


u 


Unicode 


const char* 


Comme s mais exclusivement pour les objets 
Unicode. 


u# 


Unicode 


const char*, int 


Comme s# mais exclusivement pour les objets 
Unicode. 


b 


integer 


char 


L'entier Python est converti en ti ny i nt. 


B 


integer 


unsigned char 


L'entier Python est converti en ti ny i nt, sans 
verification de depassement. La valeur passe en 
negatif dans ce cas. 


h 


integer 


shortint 


RAS 


H 


integer 


unsigned short int 


Comme h mais sans controle de depassement. 


i 


integer 


int 


RAS 


I 


integer 


unsignedint 


RAS 


1 


integer 


"longint 


RAS 
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Tableau 13-1 Formatage des parametres (suite) 



Format Type Python Type C en sortie Commentaires 
en entree 


k 


integer 


Unsignedlong RAS 


L 


integer 


PY_LONG_LONG Convertit en entier 64 bits defini par le type 
PY_LONG_LONG, lorsque la plate-forme le 
supporte. 


K 


integer 


unsignedPY_LONG_LONG RAS 


c 


string 


char 


Convertit une stri ng de 1 caractere en char. 


f 


float 


float 


RAS 


d 


float 


double 


RAS 


D 


complex 


Py_compl ex Convertit un nombre complexe en une structure C 
definie par Py_compl ex. 





objet 


PyOb j ect* Fournit un pointeur de type PyOb j ect vers 
I'objet. 


S 


string 


PyObject* 


Comme mais si I'objet n'est pas du type string, 
une erreurTypeError est levee. 


U 


Unicode 


PyObject* 


Comme mais si I'objet n'est pas du type 
uni code, une erreur TypeError est levee. 


(x, X, 
x, ...) 


tuple 


elements 


Chaque element du tuple Python est converti en 
element C. Chaque x represente un des formata- 
ges vu precedemment. 



A ces formatages s'ajoute l'operateur I, qui permet de specifier que les parametres 
suivants sont optionnels. Dans notre exemple, le format i i specifie que deux entiers 
sont attendus. 

La fonction Py_Bui 1 dVal ue permet de proceder aux memes conversions, dans le sens 
inverse. Le resultat entier C est done converti en objet integer par un appel a 
Py_Bui 1 dVal ue("i " , resul tat) . 

Definition de la table des methodes 

La fonction max() est maintenant prete a etre utilisee par l'interpreteur, et la pro- 
chaine etape consiste a la rendre visible, en definissant la table des methodes, tableau 
de type PyMethodDef . 

Chaque entree est de la forme {nom, fonction, convention d' appel, docstring}, 
avec : 

• nom : nom publie par l'interpreteur ; 

• fonction : fonction C liee ; 
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• convention d'appel : prend la valeur METH_VARARGS ; 

• docstri ng : definit la chaine de caracteres utilisee comme docstring. 

Pour max(), la table des methodes est definie comme suit, et doit etre obligatoire- 
ment renvoyee par la methode d'initialisation du module, seule fonction non statique 
du module, qui porte toujours le nom imtnommoduleQ. 

Table des methodes 

static PyMethodDef CalculsMethods[] = { 

{"max", max, METH_VARARGS , "Calcul le max de deux nombres"} 

}; 

PyMODINIT_FUNC i ni teal cul s (voi d) 
{ 

(void) Py_InitModule("calculs", CalculsMethods) ; 
} 

Py_InitModule prend en parametres le nom du module et le tableau, et renvoie un 
objet de type module qui est insere dans le dictionnaire sys. modules lorsque le 
module est importe. 

Initialisation du module 

Une fois la table des methodes prete, la fonction mai n() du module doit appeler tour 
a tour : 

• Py_SetProgramName(), pour passer argv[0] (le nom du programme) a 
l'interpreteur ; 

• Py_Ini ti al i ze () , pour initialiser l'interpreteur ; 

• appeler la methode d'initialisation du module. 

Module calculs.py complet 

#include "Python. h" 

static PyObject *max(PyObject *self, PyObject *args) 
{ 

int a; 

int b; 

int resultat; 

// recuperation des parametres 
if (! PyArg_ParseTuple(args, "ii", &a, &b)) 
return NULL; 
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// le code C 
if (a > b) 

resultat = a; 
else 

resultat = b; 

// construction d'un objet de type int renvoye a Python 
return Py_BuildValue("i " , resultat); 

} 

/* 

Table des methodes du module 

V 

static PyMethodDef CalculsMethods[] = { 

{"max", max, METH_VARARCS, "Calcul le max de deux nombres"}, 

}; 

PyMODINIT_FUNC i ni teal cul s (voi d) 
{ 

(void) Py_InitModule("calculs", CalculsMethods) ; 
} 

"int main(int argc, char *argv[]) 
{ 

// argv[0] est utilise pour initialiser le nom du module 

Py_SetProgramName(argv[0]) ; 

// initialisation de 1 'interpreteur python 
Py_Initialize() ; 

// initialisation de la table des methodes 
initcalculs() ; 



Installation de I'extension 

^installation de ce module comme extension se fait egalement par le biais du 
module di stuti 1 s . core . 

Fichier setup.py 

#! /usr/bi n/python 

# -*- coding: utf8 -*- 

from di stuti Is. core import setup, Extension 

extension = Extension(name='calculs ' , sources=['calculs.c']) 
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setup (name="calculs" , version="0. 1 beta", ext_modules= [extension] , 
maintainer="Tarek Ziade" , maintainer_email="tarek@zi ade.org" , 
description="Exemple d'extension en C") 

Ce module est ensuite invoque en ligne de commande, avec l'option build pour 
compiler le module d'extension, et i nstal 1 pour le placer dans l'interpreteur. 

Installation de I'extension sous GNU/Linux 

$ python setup. py build 

running build 

running build_ext 

building 'calculs' extension 

gcc -pthread -fno-strict-aliasing -DNDEBUC -02 -fomit-f rame-pointer 

-pipe -march=i586 -mtune=pentiumpro -g -fPIC -I/usr/include/python2 .4 -c 

calculs. c -o build/temp. linux-i686-2 .4/calculs.o 

creati ng bui 1 d/1 i b . 1 i nux-i 686-2 . 4 

gcc -pthread -shared build/temp. linux-i686-2 .4/calculs.o -o build/ 

lib. li nux-i 686-2 .4/calculs.so 

$ su 
Password: 



# python setup. py install 

running install 

running build 

running build_ext 

running install_lib 

copying build/lib.linux-i686-2 .4/calculs.so 

site-packages 



/usr/lib/python2 .4/ 



Le module est a present installe et utilisable dans le prompt. 
Test de I'extension 



>» import calculs 
>» calculs.max(9, 8) 
9 

>» calculs. max. doc 

'Calcul le max de deux nombres' 



Optimisation de I'utilisation de memoire vive 

Les problematiques de performances liees a une quantite restreinte de memoire sont 
de moins en moins frequentes pour la bonne et simple raison que son prix est devenu 
ridicule. Dans les annees 1970 et 1980, optimiser la taille memoire d'un programme 
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etait la preoccupation majeure des developpeurs et la chasse au gaspi un exercice rela- 
tivement frequent. 

Pour les programmes actuels, ce probleme est passe en second plan sauf pour des cas 
d'utilisation particuliers, ou Ton peut legitimement se poser quelques questions : 

• Quelle sera la taille occupee par un programme lorsque son nombre d'utilisateurs 
passera de 10 a 10 000 ? 

• Quelle quantite de memoire une fonction donnee a-t-elle besoin de consommer 
dans certaines conditions d'execution ? 

• Comment etre sur que le programme ne va pas depasser dans certains cas le point 
de rupture memoire, c'est-a-dire consommer toute la memoire vive disponible et 
faire passer le systeme en swapping (utilisation du disque dur comme memoire) et 
par ce biais faire chuter les performances ? 

Reproduire ces problematiques dans les tests unitaires est un bon exercice, a condi- 
tion de disposer d'un outil de mesure de charge memoire. 

Economie de memoire 

Economiser la memoire consiste a diminuer le plus possible le nombre d'objets crees, 
que ce soit par le biais de fonctionnalites du langage ou par des techniques de pro- 
grammation. Bien souvent, le travail d'optimisation se fait au cas par cas, pour modi- 
fier la consommation memoire d'un algorithme en modifiant son fonctionnement. 

Void toutefois deux techniques qui peuvent s'appliquer pour reduire la taille 
memoire d'une classe d'objets. 

slots 

Les slots des new-style classes permettent une economie substantielle de 

memoire sur les types de classes crees par le developpeur, en modifiant le fonctionne- 
ment interne des accesseurs : l'attribut diet habituellement utilise pour con- 
server les elements de chaque instance est retire au profit d'un fonctionnement diffe- 
rent (voir chapitre 6). 

Attributs statiques 

Preferer les attributs statiques permet egalement de minimiser la taille memoire prise 
par une classe d'objets, en essayant de partager au maximum les elements communs 
entres les instances. 

Cette suppression de redondance, lorsqu'elle est possible, peut permettre des gains 
considerables de memoire lorsqu'un type d'objet possede un nombre eleve d'instances. 
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Optimisation du bytecode 

Lorsqu'un fichier source est utilise par Python, l'interpreteur genere un fichier 
d'extension .pyc, contenant le code source apres le travail de l'analyseur syntaxique. 
Ce code est appele bytecode et c'est ce fichier qui est utilise pendant 1' execution du 
programme, afin d'eviter de refaire l'analyse a chaque utilisation. 

II est possible de passer l'option -0 a l'interpreteur. Le bytecode genere est alors legere- 
ment optimise par le retrait de toutes les directives d'assertions trouvees dans le code. 
L'interpreteur n'utilise plus les fichiers . pyc et compile le bytecode dans des fichiers . pyo. 

L'option -00 quant a elle retire en outre les docstrings du code, pour obtenir des 
fichiers bytecode plus compacts, mais cette option n'est pas recommandee car cer- 
taines fonctionnalites peuvent se baser sur leur lecture. 

Psyco et Cython 

Psyco et Cython sont deux outils qui permettent d'optimiser les performances, par 
deux approches differentes : 

• Psyco travaille de maniere transparente et tente d'accelerer a la volee le pro- 
gramme. 

• Cython (anciennement Pyrex) propose un nouveau langage de programmation 
qui permet d'utiliser directement des types de donnees C dans du code Python. 

Psyco 

Psyco (http://psyco.sourceforge.net), d'Armin Rigo, est une extension pour Python qui 
accelere 1' execution de certaines sequences de code. Linteret majeur de cet outil est 
qu'il opere de maniere transparente sur le code existant, sans qu'il soit necessaire de le 
modifier. 

Une fois l'outil installe, le module psyco est disponible et un simple appel a 
psyco . f ul 1 () permet de beneficier d'une optimisation transparente. 

Psyco en action 

def normal () : 
a = 
for i in range(5000): 

a = a + 3 
return a 

if name == ' main ' : 

import timeit 
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temps = ti men t.Ti me r(' normal ()' , 

'from main_ 

print('sans psyco: %f s' % temps) 

import psyco 
psyco. full () 
temps = timeit.TimerC normal ()' , 

'from main_ 

print('avec psyco: %f s' % temps) 



import normal ') .ti men t (10000) 



import normal ') .timeit(lOOOO) 



$ python psycote.py 
sans psyco: 13.725044 s 
avec psyco: 0.223533 s 

Les gains de performance sont importants sur toutes les operations arithmetiques et 
les boucles repetitives. 

Psyco analyse le code a executer a la volee et tente, lorsque c'est possible, de rem- 
placer directement ce code en memoire par son equivalent en langage machine. 

Cette mecanique a cependant des restrictions lourdes : 

• inoperant lorsque map() et fi lter() sont utilisees dans le code ; 

• impossibilite de surcharger une primitive ; 

• impossibilite de modifier dynamiquement les methodes des new-style classes ; 

• incompatible avec le module rexec ; 

• impossibilite de changer dynamiquement le type d'un objet (en modifiant son 
attribut cl ass ) ; 

• l'operateur is ne fonctionne pas toujours correctement sur les objets globaux de 
types non modifiables. 

II est done conseille de cibler son utilisation a des fonctions d'operations algorithmi- 
ques isolees. 

L'usage le plus souple consiste a creer un decorator qui permette d'enclencher Psyco 
pour des fonctions precises. Le module fournit une fonction proxy () qui permet 
d'implementer directement le decorator : elle renvoie une version optimisee de 
n'importe quel objet callable passe en parametre. 

Decorator psycoed 
import psyco 

• decorator psycoed 
def psycoed(function) : 
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try: 

return psyco. proxy (function) 
except TypeError: 
# gere le cas ou 1'objet n'a pas pu etre traite 

return function 

@psycoed 

def speedyO : 

a = 

for i in range(5000): 
a = a + 3 

return a 

Cython 

Cython (http://www.cython.org/) est un metalangage qui permet de combiner du code 
Python et des types de donnees C, pour concevoir des extensions compilables pour 
Python. 

Dans un module Cython, il est possible de definir des variables C directement dans 
le code Python et de definir des fonctions C qui prennent en parametre des 
variables C ou des objets Python. 

Cython controle ensuite de maniere transparente la generation de l'extension C, en 
transformant le module en code C par le biais des API C de Python. 

Toutes les fonctions Python du module sont alors automatiquement publiees. 

Le gain de temps dans la conception introduit par Cython est considerable : toute la 
mecanique habituellement mise en ceuvre pour creer un module d'extension est 
entierement geree par Cython. 

Ainsi, la fonction max() du module cal cul s . c precedemment presentee devient : 
Fonction max en Pyrex, calculs.pyx 

cdef max(int a, int b) : 
if a > b: 

return a 
else: 

return b 

def maximum(a, b) : 
return max(a, b) 

Les fichiers Cython ont par convention l'extension pyx, en reference a l'ancien nom. 
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Ce code genere un module d'extension par le biais d'un appel a distutils 
particulier : 

setup.py pour calculs.pyx 

from distutils. core import setup 

from distutils. extension import Extension 

from Cython. Distutils import build_ext 

extension = Extension("calculs" , ["calculs.pyx"]) 

setup(name="calculs" , ext_modules= [extension] , 
cmdcl ass={ ' bui 1 d_ext ' : bui 1 d_ext}) 

Cython gere aussi de maniere transparente les conversions de types entre C et 
Python et permet d'attaquer des modules C externes. 

Cette derniere fonctionnalite fait de Cython un concurrent direct de SWIG. Cython 
est bien souvent prefere a ce dernier car la ou SWIG impose les API des modules C 
encapsules, Cython permet d'obtenir le meme resultat tout en laissant le developpeur 
definir directement, et sans ajouter une couche Python lente, ses propres interfaces 
pythoniques. 

Cython, comme Psyco, souffre de beaucoup de limitations : 

• impossible d'imbriquer des definitions de fonctions ; 

• impossible d'utiliser yi el d et les generators ; 

• impossible d'utiliser les primitives gl obal s () et 1 ocal s () . 

II faut limiter son utilisation a des parties bien definies du programme pour eviter 
d'eventuels problemes. 



Les tests de performance continus 



Dans la logique de la programmation dirigee par les tests vue dans le chapitre prece- 
dent, il est possible : 

• de recuperer regulierement des statistiques sur les performances de toutes les 
fonctions et classes d'un programme ; 

• d'integrer des tests de performance cibles au fur et a mesure de la conception, 
pour garantir et surveiller que certaines parcelles critiques remplissent toujours les 
conditions de performance voulues. 
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Rapport sur les performances 

Les tests unitaires executent, s'ils sont bien faits, la totalite du code d'un programme. 
Un module comme hotshot peut done s'appuyer sur ces tests pour generer un rap- 
port complet sur les performances. 

Ce profiling global permet de reperer les problemes de performances ou les temps 
anormaux. 

Tests cPickle profiles 



$ python auditperfs .py 

2001 function calls in 0.020 CPU seconds 

Ordered by: internal time 

ncalls tottime percall cumtime percall filename:lineno(f unction) 
1 0.009 0.009 0.020 0.020 
audi tperf s . py : 60(test_boucl e) 

1000 0.007 0.000 0.011 0.000 

auditperfs.py : 35(test_dump_et_load) 

1000 0.004 0.000 0.004 0.000 

audi tperf s . py : 28 (_genere_i nstance) 

0.000 0.000 profile:0(profiler) 



Ran 2 tests in 1.002s 
OK 

Dans cette version du test de cPi ckl e du chapitre precedent, 1' execution des tests est 
profilee par le biais d'un decorator specialise, integrant un appel au profiler. 



Tests de performance cibles 

Pour les portions du code a surveiller etroitement, des tests de performance cibles 
peuvent etre mis en place. 

Le principe est relativement similaire aux tests unitaires mais les assertions portent 
cette fois-ci sur le temps ecoule pendant le test. 
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Test de performance d'un algorithme 

def calcui (a) : 

for i in range(lO) : 

a = a + 3 
return a 

if name == ' main ': 

""" test des performances de calcul() """ 
import timeit 

timer = timeit. Timer('ca"lcul (12) ' , 'from main import calcui') 

temps = timer. repeat() 
temps = min(temps) 
assert(temps < 4) 

Cette assertion nest pas tres precise, meme si dans l'exemple repeat () est utilisee 
pour prendre le meilleur de trois mesures, car les resultats varient enormement en 
fonction des conditions d'execution. 

De plus, les temps dependent de la machine utilisee et le temps maximal accorde a 
un test peut etre a revoir sur une machine moins puissante. II est done necessaire de 
calibrer les tests en fonction des machines cibles du programme et d'inserer des 
plages de tolerance. 

Ceci etant dit, le test remplit bien son role de garde-fou : une erreur est declenchee si 
le temps d'execution d'un algorithme critique devient anormal. 

decorator timed 

II existe des outils de mesure de performance cibles comme pyUnitPerf, de Grig 
Gheorghiu (http://sourceforge.net/projects/pyunitperf) qui est une adaptation de l'outil 
Java JUnitPerf de Mike Clark, et qui se greffe sur une classe unittest.TestCase pour 
definir un temps maximum d'execution pour la suite de tests definie dans la classe. 

Cette approche oblige cependant a ne definir qu'un nombre limite de tests dans la 
classe, voire un test unique, et necessite en outre d'ajouter du code specifique pour sa 
mise en place. 

Le seul objectif des tests de performance cibles etant de signaler qu'un test unitaire 
particulier depasse un temps maximum autorise, une autre approche plus legere est 
de concevoir un decorator. 

Le decorator presente ci-contre fonctionne sur une unite pystone. Les pystones, 
fournis par le module test . pystone mesurent les performances de la machine et per- 
mettent de rendre tous les tests de performance portables : on ne mesure plus dans ce 
cas la duree d'execution du code en secondes mais en pystones (Ps). 
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Ce decorator prend en parametre un temps maximum d'execution en Ps et affiche 
une erreur de type AssertionError en cas de depassement de ce temps. 

Decorator timedtest 

#!/usr/bin/python 

# -*- coding: utf8 -*- 
from test import pystone 
import time 

# Unite kPs 
kPs = 1000 

# TOLERANCE en Ps 
TOLERANCE =0.5 * kPs 

class DurationError(AssertionError) : pass 

def mesure_pystone() : 

return pystone. pystones(loops=pystone. LOOPS) 

def timedtest (max_pystones, local_pystones=mesure_pystone()) : 
""" decorateur timedtest """ 
if not isinstance(max_pystones, float): 
max_pystones = float(max_pystones) 

def _timedtest(function) : 

def timedtest(' v args, **kw) : 

start_time = time.time() 
try: 

return function(*args, **kw) 
finally: 

total_time = time.time() - start_time 
if total _ti me == 0: 

pystone_total_time = 
else: 

ratio = local_pystones[0] / local_pystones[l] 
temps = total_time / ratio 
if temps > (max_pystones + TOLERANCE): 

raise DurationError((('Test trop long (%.2f Ps , ' 

'duree maximum: %.2f Ps)') 
% (temps, 

max_pystones))) 
return timedtest 

return timedtest 

TOLERANCE permet de gerer un laps de temps supplemental, et sert a calibrer les 
tests en fonction de la puissance de la machine de test. 
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Le deuxieme parametre optionnel, local_pystones permet de conserver d'un test a 
l'autre le calcul des pystones, qui dure quelques secondes, pour accelerer 1' execution 
des tests. 

L'insertion de ce decorator ajoute, lorsque les tests sont lances, des controles sur les 
durees d'execution. 

Dans l'exemple ci-dessous, la classe de test effectue trois tests, dont deux sont 
mesures. 

Exemple d'utilisation 

import unittest 
import md5 

mstone = mesure_pystone() 

class MesTests (unittest .TestCase) : 

def init (self, name): 

unittest .TestCase. init (self, name) 

@timedtest(6*kPs , mstone) 
def test_criticall(self) : 
for i in range(lOOOOO) : 

md5 . new('ok') . hexdigest() 

@timedtest(l, mstone) 
def test_critical2(self) : 

ti me . si eep (mstone [0] /mstone [1] ) 

@timedtest(l*kPs , mstone) 
def test_critical3(self) : 

a =" 

for i in range(50000) : 
a = a + 'x' * 200 

def test_lesscrtitical (self) : 
time. sleep(O.l) 

suite = unittest .makeSuite(MesTests) 
unittest .TextTest Runner () . run (suite) 

[...] 

$ python perftest.py 
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FAIL: test_critica!3 ( main .MesTests) 



Traceback (most recent call last): 

File "perftest .py" , line 35, in wrapper 

raise DurationError((('Test trop long (%.2f Ps, ' 
DurationError : Test trop long (1951.56 Ps , duree maximum: 1000.00 Ps) 



Ran 4 tests in 0.319s 
FAILED (failures=l) 



Cette approche permet de mettre en place des garde-fous pour se premunir de toute 
regression des performances de l'application : l'insertion de nouveau code qui entrai- 
nerait une chute des performances pourrait alors declencher un avertissement. 



En un mot... 



Les bonnes pratiques et les techniques d'extensions presentees dans ce chapitre, et en 
particulier les code patterns, se combinent parfaitement avec la programmation 
orientee objet. 

Le prochain chapitre presente des design patterns orientes objet qui completent 
l'armada du developpeur Python. 
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Programmation orientee objet 



If it quacks like a duck then it's a duck - The Holy Grail 
« Si ca couac comme un canard, c'est un canard » - Sacre Graal 

Lorsque Python est utilise pour concevoir des programmes de grande taille, son 
organisation interne devient relativement importante. La programmation orientee 
objet est la reponse actuelle a cette problematique et rend le developpeur agile, 
c'est-a-dire rapidement reactif a des ajouts ou modifications du programme. 

Ce chapitre presente les principes generaux de la programmation orientee objet 
appliques a Python, puis une serie de recettes de programmation objet, appeles 
design patterns. 



Principes generaux 

Les concepts de programmation orientee objet (POO) ont fait leur apparition dans 
les annees soixante, avec le langage Simula-67 de Dahl et Nygaard, extension du lan- 
gage Algol. Simula ajoute a Algol la quasi-totalite des techniques de POO actuelles, 
a savoir : 

• le typage, la classification et l'encapsulation ; 

• l'heritage et le polymorphisme ; 

• les relations entre objets. 
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L'objectif originel de Simula etait de fournir aux chercheurs une bibliotheque de 
classes de simulation discrete, qui pouvait etre modifiee dans des classes derivees 
pour mettre au point un fonctionnement particulier. 

D'autres techniques complementaires ont ete introduites par la suite, dans les annees 
soixante-dix, par des langages comme SmallTalk, qui vont influencer fortement 
Python, a savoir : 

• l'heritage multiple ; 

• les classes virtuelles pures ; 

• les metaclasses ; 

• le garbage collecting. 

Typage, classification et encapsulation 

La programmation orientee objet determine que les systemes sont definis par des 
entites appelees objets, et que chacun de ces objets possede des caracteristiques defi- 
nies dans un type d'objet. 

Typage de Liskov 

Selon la theorie des types de Liskov, un type determine un ensemble de caracteristi- 
ques que partageront les objets appartenant a ce type. 

Ces caracteristiques prennent la forme de methodes et de valeurs pour 1' objet et sont 
definies par une classe. Cette classe contient le code a proprement parler et tout objet 
de ce type est appele instance de classe. 

Liskov stipule en outre qu'il est possible de creer une sous-classification par le biais 
de l'heritage, presente ci-apres. 

Enfin, cette classification introduit un mecanisme de substitution lorsque deux classes 
partagent des caracteristiques communes : substituer une classe par une autre sans que 
le code utilisateur ne soit impacte est appele principe de substitution de Liskov 

Principe de substitution de Liskov 

Prenons l'exemple d'une classe A, qui utilise dans sa methode calcul (), la methode 
sous_calcul () d'une classe B. Cette dependance fonctionnelle rend A tributaire 
de B. B peut implementer d'autres methodes sans que cela ne gene A car la seule 
chose qui interesse A est la methode sous_calcul (). 

En d'autres termes, remplacer B par une classe C qui fournisse aussi une methode 
sous_cal cul O ne derangera pas A, qui y trouve son compte. 

Cette dependance peut done etre remontee dans une abstraction commune a B et C. 
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L'exemple ci-dessous implemente le principe de substitution de Liskov s'assurant 
que l'objet passe a A est derive du type Base. 

Substitution de Liskov en Python 

#!/usr/bin/python 

# -*- coding: utf8 -*- 

class Base(object) : 

""" classe virtuelle pure """ 
def sous_calcul (self) : 

raise NotlmplementedError 

class A: 

""" classe utili sat rice """ 

def "init (self, sous_objet): 

ifnot isinstance(sous_objet , Base): 

raise TypeError("A ne travaille qu'avec Base ou derives") 
self .sous_objet = sous_objet 

def calcul(self): 

return 1 + self .sous_objet .sous_calcul () 

class B(Base) : 

""" classe B """ 
def sous_calcul (self) : 
return 1 

class C(Base) : 

""" classe C """ 
def sous_calcul (self) : 
return 2 

# Utilisation de A avec B ou C 
print(A(B()).calcul()) 
print(A(C()).calcul()) 

Ce principe peut egalement etre implemente avec les ABC presentees au chapitre 9. 
Implementation avec ABC 

>» from abc import ABCMeta, abstractmethod 
>» class Base(object) : 

metaclass = ABCMeta 

©abstractmethod 
... def sous_calcul (self) : 

pass 
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©classmethod 

def subclasshook (els, C) 

if els is Base: 

if any("sous_calcul " 
for sub in C. 
return True 
return Notlmplemented 



in sub. dict_ 

_mro ) : 



class A(object) : 

def init (self, sous_objet): 

if not isinstance(sous_objet, Base): 

raise TypeError("A ne travaille qu'avec Base ou derives") 
self .sous_objet = sous_objet 
def calcul(self): 

return 1 + self . sous_objet .sous_calcul () 

class B(object) : 

def sous_calcul (self) : 
return 1 

class C(object): 

def sous_calcul (self) : 
return 2 

class D(object) : 
pass 



>» print(A(B()) .calcul ()) 

2 

>» print(A(C()). calcul ()) 

3 

>» print(A(D()) .calcul ()) 

Traceback (most recent call last): 



File 
File 



'<stdin>' 
'<stdin>' 



line 1, in <module> 
line 4, in init 



TypeError: A ne travaille qu'avec Base ou derives 

Encapsulation 

Quel que soit le typage utilise, l'objectif des classes reste de separer l'interface de 
l'implementation. L'interface est representee par l'ensemble des methodes et donnees 
que les utilisateurs de la classe connaissent, et l'implementation est representee par 
toute la mecanique interne. Cette encapsulation permet de rendre les utilisateurs de 
la classe independants de la representation interne. 
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Les methodes et donnees internes sont dites privees et celles faisant partie de l'inter- 
face de la classe dites publiques. Dans certains langages, une visibilite intermediate 
permet de definir que des attributs ne sont visibles que des sous-classes. On parle 
alors d'attributs proteges. 

Certains langages objet, comme le C++, definissent de maniere stricte cette visibilite 
en fournissant des mots-cles pour caracteriser chaque element d'une classe. 

Python fonctionne quant a lui sur un modele moins strict, base sur des conventions 
de nommage des attributs : un attribut prive est toujours prefixe de deux espaces sou- 
lignes et un attribut protege d'un seul espace souligne. 



A RETENIR Attributs prives et proteges 

En langage Python, les attributs prives sont definis en prefixant leur nom de deux espaces soulignes et 
les attributs proteges d'un seul espace souligne : 

attrl, attr2 # noms d'attributs prives 

_attr3, _attr4 # noms d'attributs proteges 



L'interpreteur protege les attributs prives en les prefixant en interne du nom de la 
classe, les rendant inaccessibles par du code exterieur. Cette protection nest cepen- 
dant pas inviolable puisqu'il est possible d'acceder a tous les elements en fouillant 
l'attribut di ct . Mais la n'est pas l'objectif. 

Enfin, les methodes protegees sont accessibles tout a fait normalement et le prefixe a 
pour seul objectif d'informer sur leur nature. 

Telephone 

#!/usr/bi n/python 

# -*- coding: utf8 -*- 

class Telephone(object) : 

def init (self) : 

# donnees privees 

self. numero_serie = ' 123Nouzi ronAuBois456DesCerises' 

# donnees protegees 
self._code_pin = '1234' 

# donnees publiques 

self. modele ='nokai kitu 45' 
self.numero ='06 06 06 06 06' 

# methodes protegees 

def _chercherReseau(self) : 

print('Reseau FSR, bienvenue dans un monde meilleur..') 
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def _recupMessage(self) : 

printC'Vous n'avez pas de message") 
print("Achetez les corn flakes Snapk") 

# interface 

def allumer(self , code_pin): 
pri nt (self .model e) 

if code_pin == self. code_pin: 

print('Tu ti Tu Ti ') 
self ._chercherReseau() 
self ._recupMes sage () 
else: 

print('mauvais code pin') 

if name == ' main ': 

nokai = TelephoneO 
nokai .anumer('1524') 
nokai .anumer('1234') 

Dans l'exemple ci-dessus, la classe Telephone encapsule toute une mecanique de 
fonctionnement interne dont n'a pas idee l'utilisateur qui se contente d'invoquer 
allumer(). 

Heritage et polymorphisme 

Liskov introduit le principe de i'heritage, qui stipule qu'une sous-classe B herite de 
toutes les caracteristiques d'une classe A. La classe B est une classe A, avec des ele- 
ments modifies et/ou supplementaires. On parle de specialisation de A, et on dit que 
B est derivee de la classe de base A. 



Heritage 

En reprenant l'exemple precedent, une specialisation possible de la classe Telephone 
est Tel ephonePhoto. 

Specialisation de Telephone 

class TelephonePhoto(Telephone) : 
def prend_photo(self) : 
print('clik-clak') 

if name == ' main ': 

nokai = TelephonePhotoO 
nokai .allumer('1234') 
nokai . prend_photo() 
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Cette nouvelle classe herite des caracteristiques de la classe Tel ephone et y ajoute une 
methode supplementaire. Seul le numero de serie n'est plus accessible dans cette spe- 
cialisation. 

Cette classe peut etre a son tour derivee dans une autre classe. 
Specialisation de TelephonePhoto 

class TelephonePhotoHautdeCamme(TelephonePhoto) : 
def fait_cafe(self) : 

printCplik, plik, plik') 

if name == ' main ' : 

nokai = TelephonePhotoHautdeGammeO 
nokai .allumerC 1234') 
nokai .prend_photo() 
nokai .fait_cafe() 

Ces suites de derivations forment un arbre de derivation. 

Polymorphisme 

Lorsque la classe specialised implemente les memes methodes que la classe dont elle 
derive, on dit que les methodes sont surchargees. 

TelephonePhotoHautdeGamme modifiee 

class TelephonePhotoHautdeCamme(TelephonePhoto) : 
def fait_cafe(self) : 

printCplik, plik, plik') 

def prend_photo(self) : 

print('clik-clak deluxe') 

Ici, la methode prend_photo() est surcharged et prevaut sur celle de Tel ephonePhoto. 
La methode est dite virtuelle (en Python, toutes les methodes sont virtuelles). 

II reste cependant possible d'atteindre la methode des classes heritees dans les 
niveaux precedents dans l'arbre de derivation, en appelant cette methode directement 
depuis la classe concernee, en passant l'objet derive en premier parametre. 

Polymorphisme 

class Tel ephonePhoto(Tel ephone) : 

def init (self) : 

Telephone. init (self) 

self.modele = 'nokai kitu 45 Photo+' 
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def prend_photo(self) : 
print('clik-clak') 

def _recupMessage(self) : 

Tel ephone._recupMessage (self) 

print("Vous n'avez pas non plus de photos") 



class Tel ephonePhotoHautdeGamme (Telephone) : 

def prend_photo(self) : 

printCcli k-clak de luxe') 

def allumer(self , code_pin): 

print self.modele + ' deluxe' 
if code_pin == self ._code_pin: 

print('Tu ti Tu Tiiiiilliiilll') 

self ._chercherReseau() 

self ._recupMes sage () 
else: 

print('baaaaaaaaaaazzzz') 

def _recupMessage(self) : 

Tel ephone._recupMessage (self) 

print("Vous n'avez pas non plus de photos deluxe") 

if name == ' main ': 

nokai = TelephonePhotoHautdeGammeO 
nokai .allumer('1234') 
nokai . prend_photo() 

[tziade@Tarek Desktop] $ python cl asses. py 

nokai kitu 45 deluxe 

Tu ti Tu Tiiiiilliiilll 

Reseau FSR, bienvenue dans un monde meilleur.. 

Vous n'avez pas de message 

Achetez les corn flakes Snapk 

Vous n'avez pas non plus de photos deluxe 

cli k-clak de luxe 

Les methodes deviennent polymorphiques et il est possible de composer avec tous les 
niveaux de l'arbre de derivation. 
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Duck typing et interfaces 

Python n'utilisant pas de typage statique, le code peut se baser sur une philosophie de 
programmation polymorphique plus souple, qui tient en une phrase : If it quacks like 
a duck, then it's a duck (litteralement : si 9a fait « coin-coin », c'est un canard). 

Cette citation, tiree du film Sacre Graal, signifie que le type des objets peut etre 
devine par les attributs qu'ils portent. Ou plus precisement : si un objet porte un cer- 
tain nombre d'attributs, il fait l'affaire. 

C'est ce principe qui est applique dans le code qui utilise les objets de type fichier ou 
assimiles, offrant ainsi la possibilite de substituer un objet de type StringlO dans du 
code prevu pour un objet de type f i 1 e. 

Le duck typing se base sur 1'utilisation de la primitive hasattrO pour analyser les 
attributs d'un objet et evite les primitives isinstanceO, type() ou assimiles. 

Duck typing 

>» import cStringlO 

>» def "litdonnees(objet) : 

... ifnot hasattr(objet, 'readline'): 

... raise TypeError("l 'objet n'a pas de fonction de lecture") 

... return objet. readline() 

>» objectl = cStringIO.StringIO('contenu ') 
>» litdonnees (objectl) 
'contenu' 

>» class Compatible(object) : 
... def readline (self) : 
return ' pas de pb' 

>» object2 = Compatible() 

>» litdonnees(object2) 

'pas de pb' 

>» object3 = object() 

>» litdonnees(object3) 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "<stdin>", line 3, in litdonnees 
TypeError: l'objet n'a pas de fonction de lecture 

Cette philosophie influence fortement l'orientation du programme en termes 
d'architecture et modifie le role de l'heritage : il n'est plus forcement utilise lorsqu'il 
s'agit d'offrir le sesame a certaines fonctions pour un nouveau type de classe. 
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On retrouve le principe strict du duck typing dans les gros frameworks comme Zope 
ou Twisted : des interfaces peuvent etre definies pour decoupler la description des 
caracteristiques que des objets doivent necessairement avoir pour etre utilises dans 
certaines fonctions. Les caracteristiques de 1' objet sont automatiquement testees par 
des API specialises. 

Les interfaces selon Zope 3 

>» import zope. "interface 

>» class ILInterface(zope. interface. Interface) : 
... """ Mon interface """ 

... attribut = zope. interface. Attribute("""C'est 1 'attribut'"'") 

... def methode(parametre) : 

"""la methode""" 

>» class TresClasse(object) : 

zope . i nterf ace . i mpl ements (ILInterf ace) 

... def init (self, valeur=None) : 

... self .attribut = valeur 

... def methode(self , parametre) : 

... return parametre, self .attribut 

>» def ma_fonction(objet) : 

... ifnot ILInterface. providedBy(ILInterface) 

raise TypeError("cet objet ne couac pas") 
... print objet. attribut 

>» la_class = TresClasse('trop classe') 
>» ma_fonction(la_class) 
'trop classe' 

Les interfaces sont comparables aux ABC, puisqu'elles permettent aussi de separer la 
signature d'un comportement du code qui l'implemente dans une ou plusieurs classes. 



Relations entre objets 

Sans rentrer dans les details semantiques, on peut considerer qu'une classe peut 
former deux types de relations avec une autre classe : 

• une relation de composition simple, ou 1' attribut d'une classe A est une instance 
d'une classe B ; 

• une relation multiple ou la classe A gere une collection, explicite ou non, d'instan- 
ces de la classe B. 

Lobjectif des relations entre classes est identique a celui entre fonctions : decom- 
poser de maniere logique le code necessaire a 1' execution d'une tache. 
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Cette decomposition permet a chaque portion de code : 

• d'evoluer de maniere independante et de se specialiser ; 

• d'etre reutilisable dans d'autres taches ; 

• de decouper en taches elementaires des taches plus complexes. 

Relation simple 

Dans l'exemple ci-dessous, la classe Afficheur se sert de la classe Calculateur pour 
fournir une interface a l'utilisateur. 

Afficheur-Calculateur 

class Calculateur(object) : 

""" classe de calculs """ 
def somme(self, *args) : 
resultat = 
for arg in args: 

resultat += arg 
return resultat 

class Afficheur(object) : 

""" classe de gestion de 1 'interface """ 

def init (self) : 

self ._calculateur = CalculateurO 

def somme(self, *args) : 

resultat = self ._calculateur.somme(*args) 
print('le resultat est %d' % resultat) 

Cette relation qui s'instaure entre 1' afficheur et le calculateur permet au code d'affi- 
chage des resultats d'evoluer independamment du code qui effectue le calcul a pro- 
prement parler, et inversement. 

Relation multiple 

Les relations multiples peuvent etre implementees tres simplement par le biais 
d'objets capables de gerer des sequences d'elements, comme les listes ou les diction- 
naires. 

Dans l'exemple ci-apres, la classe Voiture gere une liste de quatre instances d'objet 
Roue. 
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Voiture, toutes options 

class Roue(object) : 
pass 

class Venture (object) : 

def ii-n't (self): 

self. roues = [Roue() for i in range(4)] 

La classe Roue ici est totalement independante de la classe Voiture : si la voiture 
cesse de fonctionner, il est possible de demonter les roues pour les vendre. 

Les dictionnaires permettent quant a eux de disposer d'une interface de manipulation 
plus directe : chaque objet de la collection est etiquete par la cle de dictionnaire. 

Les quatre filles du docteur Mars 

class FilleMars(object) : 

def "init (self, prenom) : 

self.prenom = prenom 

def str (self) : 

return '%s Mars' % self.prenom 



class PapaMars: 

def init (self) : 

self. filles = {} 
self .filles['Gibouled'] 
self .filles[' Josiane'] = 
self .filles ['Rebecca'] = 
self.filles['Sebonle'] = 



= FilleMars('Gibouled') 
Fi 1 1 eMars ( ' losi ane ' ) 
FilleMarsC Rebecca') 
Fi 1 1 eMars ( ' Sebonl e ' ) 



def crie_a_table(self) : 
import sys 
for nom in self. filles: 

sys.stdout.write('%s, ' 
sys.stdout.write('a table 

docteur = PapaMarsO 
docteu r . cri e_a_tabl e () 



% self .filles [nom]) 
! Le tbrglut va refroidir !\n') 



Heritage multiple 



Lheritage multiple sert a specifier qu'une classe peut heriter de plusieurs classes. 
Lorsque des methodes entrent en conflit car portant le meme nom, la methode 
visible est la premiere rencontree par l'interpreteur, qui balaye les classes de gauche a 
droite au moment de l'interpretation. 
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Heritage multiple 

>» class A(object): 
def a(self): 

print ('A. a') 

class B(object) : 
def a(self): 

print('B.a') 
def b(self): 

print('B.b') 

class C(A, B): 
def c(self): 

print('C.c') 
def Aa(self): 

A.a(self) 

>» ob = C() 

>» ob.a() 

A. a 

>» ob.b() 

B.b 

>» ob.c() 

C.c 

>» ob.Aa() 

A. a 



En pratique, l'heritage multiple est a proscrire tant que possible car il peut etre assez 
delicat a gerer : la complexite et les caracteristiques de la classe se demultiplient. 



Metaclasses 



Les metaclasses en Python ont ete introduites par le biais de la variable 
metaclass , presentee au chapitre 5. 



Garbage collecting 



un mecanisme 



Comme la plupart des langages modernes, Python offre 
ramasse-miettes, ou garbage collecting : toute reference de classe creee en memoire est 
automatiquement liberee par l'interpreteur. Le developpeur n'a done plus besoin de 
gerer la liberation de ses objets. 
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Design patterns orientes objet 



Le concept de design pattern oriente objet a emerge avec les travaux de Gamma, 
Helm, Johnson et Vlissides (appeles Gang of Four, ou GoF). Leur ouvrage, Design 
Patterns: Elements of Reusable Object-Oriented Software (Addison Wesley, 1995), 
regroupe des solutions a des problemes recurrents de programmation. 

Un pattern, selon le GoF, doit : 

• porter un nom unique ; 

• proposer une solution a un probleme clairement enonce ; 

• decrire precisement les relations entre chaque acteur ; 

• determiner les consequences de son utilisation. 

En phase d'analyse, ce vocabulaire commun entre tous les developpeurs permet de 
decrire et concevoir la structure d'un programme objet de maniere tres precise. On 
parle alors de Visitor, Mediator ou autre Factory. 

Concus a l'origine pour le C++, les design patterns (que nous nommerons parfois DP 
par commodite dans la suite de chapitre) du GoF s'appliquent avec plus ou moins de 
facilite et de bonheur dans les autres langages. 

L'objectif de cette section est de presenter les DP dans le contexte de Python et de 
proposer des implementations avec les new-style classes. 

Le GoF a regroupe les design patterns en plusieurs ensembles : 

• les patterns de generation d'objets : composants en charge de creer de maniere 
controlee des objets ou structures d'objets ; 

• les patterns fonctionnels : composants en charge d'implementer un mode 
d'execution ; 

• les patterns structurels : composants en charge d'organiser les relations entre plu- 
sieurs classes, pour constituer une structure cooperative. 

Patterns de generation d'objets 

Lorsqu'un programme doit instancier un objet, la maniere la plus simple est 
d'appeler le constructeur d'une classe. Les patterns de generation d'objets fournissent 
des outils de plus haut niveau pour controler ces creations. 

Le code utilisateur ne s'adresse plus directement aux classes mais emploie les services 
de ces patterns, sauf lorsque ces outils sont implementes de maniere transparente. 

Les patterns les plus communs de cet ensemble sont : 

• Le pattern Singleton qui permet de s' assurer qu'un type de classe ne peut etre ins- 
tancie qu'une seule fois dans un programme. Une variation est le pattern Borg, 
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qui verifie que toutes les instances d'une meme classe ont toujours le meme etat, 
sans pour autant interdire la creation de plusieurs instances. 
• Factory, qui propose une interface de generation d'objets sans que le code appe- 
lant n'ait besoin de connaitre forcement le type de classe a instancier. 

Singleton et Borg 



Figure 14-1 

Schema UML de Singleton 



Singleton 



ref 



+ nev [cls,*args,**kw) 



Le Singleton peut etre utilise dans tout contexte ou Ton souhaite s'assurer qu'il ne 
peut pas y avoir pour une classe donnee deux instances actives dans le programme. 

Les connecteurs vers des ressources externes peuvent utiliser ce pattern pour s'assurer 
par exemple qu'il n'existe qu'une seule instance de la classe en charge de la connexion 
avec un serveur de base de donnees. 

Ce pattern peut etre programme en Python, en se basant sur la methode de classe 
new (), appelee a chaque demande d'instanciation d'un objet. 

Singleton 

>» class Singleton(object) : 

""" renvoi e tjrs la meme instance """ 
_ref = None 

def new (els, *args, **kw) : 

if cls._ref is None: 

cls._ref = super(Singleton , els). new (els, *args, **kw) 

return cls._ref 

>» class S(Singleton) : 
pass 

>» a = S() 

>» b = S() 

>» a is b 
True 

Toute classe derivee de la classe Singleton beneficie du mecanisme qui consiste a 
controler, au moment de l'instanciation d'un objet, qu'il n'existe pas deja une ins- 
tance en vie, par le biais de l'attribut statique _ref. Dans ce cas, l'objet n'est pas 
recree et e'est cette instance qui est renvoyee. 
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La seule faille de Si ngl eton est qu'il n'est effectif que pour les classes dont il est 
directement derive, car un deuxieme niveau de derivation entraine un probleme 
visualise dans l'exemple ci-dessous. 

Deux niveaux de derivation 

>» class Singleton(object) : 
... """ renvoie tjrs la meme instance """ 

_ref = None 

... def new (els, *args, **kw) : 

... if cls._ref is None: 

... cls._ref = super(Singleton, els). new (els, *args, **kw) 

return els. ref 

>» class S(Singleton) : 
pass 

>» class S2(S) : 
pass 

>» a = S() 

>» b = S2() 

>» type(b) 

<class ' main .S'> 

L'instanciation de b renvoie a l'objet instancie precedemment par a et b n'est pas, 
comme le code semblerait l'indiquer, du type S2, mais du type S. 

Ce probleme est intrinseque au pattern Singleton mais une variante consiste a lever une 
exception sur toute nouvelle tentative d'instanciation au lieu de renvoyer le premier objet 
pour eviter de rendre ce mecanisme transparent et de subir les problemes enonces. 

Strict Singleton 

>» class SingletonError(Exception) : 
pass 

>» class Singleton(object) : 

... """ provoque une erreur sur la deuxieme instance """ 
_ref = None 

... def new (els, *args, **kw) : 

... if els. ref isnot None: 

... raise SingletonError('Une instance existe deja: %s' 

% str(cls._ref)) 

... cls._ref = super(Si ngl eton , els). new (els, *args, **kw) 

return els. ref 
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>» class S(Singleton) : 
pass 

>» class S2(S) : 
pass 

>» a = S() 

>» b = S2() 

Traceback (most recent call last): 

File "<stdin>", line 1, in ? 

File "<stdin>", line 6, in new 

main .SingletonError: Une instance existe deja: < main .S object at 

0xb7c32a6c> 

Alex Martelli, dans Python Cookbook (O'Reilly, 2001), propose une autre variante de 
Singleton, nommee Borg ou Monostate, qui regie aussi ce probleme et repond au 
besoin du Singleton de maniere plus fine : il part du constat que ce n'est pas l'unicite 
de l'instance qui compte mais l'unicite de l'etat de l'objet. 

En d'autres termes, peu importe qu'il y ait plusieurs instances du moment qu'elles 
partagent toutes le meme etat. 

Pattern Borg 

>» class Borg(object) : 

_shared_state = {} 

def new (els, *args, **kw) : 

instance = super(Borg, els). new (els, *args, **kw) 

instance. diet = cls._shared_state 

return instance 



>» class B(Borg) 




pass 


>» a = 


BO 


>» a. A 


= 1 


>» b = 


BO 


>» b.A 




1 




>» b.B 


= 2 


>» a.B 




2 




>» a is b 


False 





Borg rend commun a toutes les instances de la classe le dictionnaire interne 

di ct , et de par ce fait l'etat. Le probleme lie a plusieurs niveaux de derivations 

disparait aussi. 
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Ce pattern est cependant dependant d'eventuelles implementations des methodes 
setattr () et getattri bute () qui peuvent court- circuiter di ct . 

D'autres variations existent, comme Flyweight, qui proposent un fonctionnement 
similaire a Singleton, mais gerent un certain nombre d'instances definies par des 
combinaisons de parametres au moment de la construction, afin d'optimiser les crea- 
tions d'objets en memoire lorsque c'est important. 

Factory 

Le DP Factory est une fonction ou methode qui renvoie une ou plusieurs instances 
d'objets. Factory est omnipresent en Python, et l'exemple le plus parlant est la primi- 
tive type(). 

Exemple d'utilisation de type() 

>» MaClasse = type('MaGasse' , (object,), {'a': 1}) 
>» A = MaClasse () 
>» A . a 
1 

>» class MaClasse(object) : 
a = 1 

>» A = MaClasseO 
>» A . a 

1 

La premiere ecriture permet de generer tout type de classe et est equivalente a la 

deuxieme ecriture explicite. Un autre exemple de Factory est la methode new () 

des new-style classes, qui controle la generation des instances de la classe. 

Le champ d'action du DP Factory est relativement large et on peut se demander si 
finalement, toute fonction qui renvoie un resultat ne repond pas a ce pattern, puisque 
tout est objet en Python. 

II y a cependant un exemple d'utilisation plus concret de ce DP : lorsque le type 
d'objet renvoye par le Factory varie sans que le code appelant ne soit sensible a cette 
variation. On parle dans ce cas d'Abstract Factory. 

Par exemple, un Abstract Factory en charge de renvoyer une instance de connecteur 
de base de donnees peut le faire en partant du postulat que le type d'objet renvoye 
importe peu, du moment qu'il derive de la classe BaseDB. Le code appelant ne se 
basant que sur les methodes definies par BaseDB, il reste insensible au type de 1' objet, 
que ce soitOracleDB ou PostGresDB. 
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Patterns fonctionnels 

Les patterns fonctionnels permettent de mettre en place des modeles d'execution du 
programme, c'est-a-dire de modeliser les relations qui se mettent en place entre 
objets lorsqu'ils cooperent pour executer une tache. 

II existe enormement de patterns fonctionnels et les variantes sont nombreuses. On 
ne presente ici que quelques DP majeurs : 

• Le pattern Visitor, qui permet de manipuler des instances d'objets depuis un 
algorithme recursif ; 

• Observer, qui met en place un systeme de notification, ou des objets sont preve- 
nus d'un evenement sur un objet donne ; 

• Memento, un systeme de memorisation de l'etat d'un objet ; 

• Chain of responsibility, qui met en place une chaine d'objets, utilisee pour resou- 
dre un probleme : le premier maillon de la chaine qui sait resoudre le probleme 
prend la main ; 

• State, qui permet de changer dynamiquement le type d'un objet. 

Visitor 



Figure 14-2 

Schema UMLde Visitor 



Visitor 








- call [self , visited) 














A 




Visited 








+accept[self, visitor) 



Le pattern Visitor permet d'ajouter une methode recursive a une classe dans une 
autre classe specialisee. Cette deuxieme classe, appelee visiteur, implemente une 
extension qui manipule la premiere classe. 

Visitor 



class Visitor(object) : 

def call (self, visited): 

raise NotlmplementedError 

class Visited(object) : 

def accept(self, visitor): 
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ifnot isinstance(visitor , Visitor): 

raise TypeError("%s n'est pas un Visitor" % visitor) 
visitor(self) 

Chaque visiteur dispose en entree de la fonction call () l'objet visite, qu'il peut 

manipuler a sa guise. La classe visitee fournit quant a elle une methode accept () 
pouvant etre appelee par tout visiteur. 

Cette mecanique appelant- appele permet de mettre en place des algorithmes recur- 
sifs bases sur des objets organises en structure. 

L'exemple le plus typique est le parcours d'arbres par le biais d'objets noeuds. 

Dans l'exemple ci-dessous, le visiteur Tick parcourt une structure de nceuds pour 
declencher les methodes ti ck() de chaque nceud. 

Visitor sur MaClasse 



class Node(Visited) : 

def init (self) : 

self.childs = [] 

def tick(self): 

print('tick at %d' % id(self)) 

class Tick(Visitor) : 

def call (self, visited): 

visited. tick() 

for child in visited.childs : 
child. accept (self) 

root = Node() 

for i in range(2) : 
node = Node() 
for y in range(4) : 

node. chi Ids. append (Node ()) 
root . chi 1 ds . append (node) 

ticker = Tick() 
ticker(root) 

[..] 

[tziade@Tarek Desktop]! python visitor.py 
tick at -1211997076 
tick at -1211995892 
tick at -1211995828 
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tick at 
tick at 
tick at 
tick at 
tick at 
tick at 
tick at 
tick at 



-1211995796 
-1211995764 
-1211995732 
-1211995860 
-1211995668 
-1211995636 
-1211995604 
-1211995572 



Linteret de ce DP est de permettre l'extension d'une classe sans avoir a modifier son 
code, et de gerer chacune des extensions en fonction des situations et des instances : 
le visiteur greffe a une instance de la classe visitee une nouvelle fonctionnalite, dans le 
meme principe que le DP Adapter. 

Chaque visiteur peut en outre gerer plusieurs types de classes visitees pour parcourir 
des structures heterogenes. 

Observer 



Figure 14-3 

Schema UML d'Observer 



Observateur 



+ call [self , *args,**kw) 



Event 



+name 

# observateurs 



_init [self .name) 

_iadd [self , observateur) 

_isub [self , observateur) 

_call [self , *args, **kv) 



Obsei"ve 



+evenemenent : Event 



Le DP Observer definit une dependance de 1 a n entre un objet et une liste d'objets. 
Si l'objet change d'etat, tous les objets associes, en l'occurrence les observateurs, sont 
notifies de cet evenement. 

Ce pattern est tres repandu dans les systemes d'interfaces graphiques, ou chaque eve- 
nement de l'utilisateur est intercepte par un objet qui est en charge de prevenir a son 
tour un certain nombre d'objets. 

Le pattern initialement propose par GoF stipule que les observateurs sont sensibles a 
toute modification d'etat de l'objet observe. Une variation, tres communement 
adoptee, affine ce mecanisme en laissant chaque observateur s'inscrire a un evene- 
ment precis et nomme. 
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Pour implementer Observer le code doit : 

• Fournir une methode d'enregistrement pour que chaque observateur puisse s'ins- 
crire a un evenement donne aupres de l'objet a observer. 

• Implementer un systeme qui intercepte un changement d'etat et previent les 
observateurs inscrits. 

L'evenement est logiquement une classe a laquelle une liste est associee. Cette liste 
contient l'ensemble des observateurs associes a l'evenement. 

Pour simplifier l'ecriture, i add () et i sub () sont utilisees afin de permettre a 

un observateur de : 

• s'inscrire en s'ajoutant a l'evenement : Evenement += Observateur; 

• se desinscrire en se soustrayant : Evenement -= Observateur. 

L'implementation proposee empeche en outre un meme observateur de s'inscrire 
plusieurs fois a un evenement. 

Classe Event 



class Event(object) : 

""" Classe evenement """ 
def "init (self, name): 

self. name = name 

self ._observateurs = [] 

def "iadd (self, observateur): 

""" ajoute un observateur """ 
ifnot callable(observateur) : 

raise TypeError("Doit etre un objet appelable") 

observateurs = self ._observateurs 
if observateur notin observateurs: 
observateurs . append(observateur) 

return self 

def isub (self, observateur): 

""" retire un observateur """ 
observateurs = self ._observateurs 
if observateur in observateurs: 
observers. remove(observateur) 

return self 

def call (self, *args, **kw) : 

""" declenche l'evenement aupres de tous les inscrits """ 
[observateur(*args, **kw) for observateur in self ._observateurs] 
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La classe observee instancie ces evenements en attributs pour les rendre accessibles 
aux observateurs. 

Enfin, les evenements peuvent ensuite etre declenches en fonction des besoins dans le 
code de la classe, par la biais de la methode cal 1 (), avec les parametres souhaites. 

Pattern Observer 

class Fenetre(object) : 

def "init (self, name): 

self. name = name 

self.titre = 'titre de la fenetre' 
self.contenu = 'contenu de la fenetre' 
self .titreEvent = Event('titre') 
self .contenuEvent = EventC contenu') 

globalTitreEvent = Event('t"itre global') 

def changeTitre(self , titre): 
self.titre = titre 
self . titreEvent (tit re) 
Fenetre. global TitreEvent (self. name, titre) 

def changeContenu(self , contenu): 
self.titre = contenu 
self. contenuEvent (contenu) 

class ObservateurTit re (object) : 

def init (self, fenetre): 

fenetre. titreEvent += self 

def call (self, titre): 

print ('le titre a ete change en "%s" !' % titre) 

class ObservateurContenu(object) : 

def init (self, fenetre): 

fenetre. contenuEvent += self .contenuChange 

def contenuChange(self , contenu): 

print('le contenu a ete change en "%s" !' % contenu) 



class ObservateurClobal (object) : 

def init (self, fenetre): 

fenetre. globalTitreEvent += self 

def call (self, name, titre): 

print('le titre de "%s" a ete change en "%s" !' \ 
% (name, titre)) 
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fenetre = Fenetre('fenetre 1') 
fenetre2 = Fenetre ('fenetre 2') 

obi = ObservateurTitre(fenetre) 
ob2 = ObservateurContenu(fenetre) 
ob3 = ObservateurGlobal (fenetre) 

fenetre . changeTi tre( ' nouveau ti tre ' ) 
fenetre.changeContenuC nouveau contenu ') 
fenetre2 .changeTi tre ('nouveau t"itre2 ') 

Les evenements peuvent etre statiques a la classe, comme global TitreEvent, ou spe- 
cifiques a chaque instance. 

Execution du script 

[tziade@Tarek Desktop] $ python observers. py 

le titre a ete change en "nouveau fitre" ! 

le fitre de "fenetre 1" a ete change en "nouveau titre" ! 

le contenu a ete change en "nouveau contenu" ! 

le fitre de "fenetre 2" a ete change en "nouveau fitre2" ! 

D'autres variations sont possibles, notamment : 

• proposer une implementation de base de la classe observee, pour gerer des collec- 
tions d'evenements ; 

• rendre les observateurs actifs, c'est-a-dire declencher les evenements avant que le 
code qui modifie l'etat ne soit effectue, pour qu'ils puissent influer sur les parame- 
tres d'execution, ou meme empecher la suite de l'execution ; 

• donner la possibilite a un observateur de connaitre les autres observateurs ; 

• gerer des priorites dans l'ordre d'appel des observateurs ; 

• etc. 



Memento 

Le DP Memento stipule que l'etat d'un objet peut etre sauvegarde a tout moment, et 
recharge avec cette sauvegarde en cas de besoin. Cette memoire permet de mettre en 
place du code transactionnel. 

L'exemple le plus commun de code transactionnel est l'execution de requetes de mise 
a jour d'une base de donnees relationnelle : en cas de probleme, un retour en arriere 
{rollback) est possible, pour remettre la base dans l'etat precedent le debut de la mise a 
jour. En cas de succes, les modifications sont validees {commit). 
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Une transaction respecte done le modele de code suivant : 
Code transactionnel 

begi n_transaction() 
try: 

except : 

rol 1 back_transaction() 
raise 
else: 

commi t_t ransacti on () 

La limite de couverture de begi n_t ransacti on () est relativement floue et depend 
fortement du contexte : quelles sont et ou sont les donnees a sauvegarder pendant la 
transaction ? 

Ce probleme depend entierement du contexte, et Implementation proposee ci-dessous 
place la granularite des transactions au niveau des classes : chaque methode peut devenir 
transactionnelle, et les attributs de l'objet sont les cibles de la sauvegarde. 

L'implementation la plus souple dans ce cas consiste a creer un decorator de classe pour 
rendre transparente la transaction : chaque methode transactionnelle peut etre annotee 
avec le decorator, qui se charge alors de sauvegarder l'etat de l'objet et d'executer la 
methode. En cas de levee d'exception, un rollback est automatiquement effectue. 

Memento 
import copy 

def get_memento(objet) : 

""" recupere l'etat d'un objet """ 
return copy. deepcopy (objet. diet ) 

def set_memento(objet, etat) : 
""" restore un objet """ 

objet. diet .clear() 

objet . di ct . update(etat) 

def transaction(methode) : 

""" decorator de classe "transaction" 

rend les methodes transactionnelles 

def capsule(objet, "'-args, **kw) : 
etat = get_memento (objet) 
try: 

return methode(objet , -args, **kw) 
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except : 

set_memento(objet , etat) 
raise 

return capsule 

Le code est base sur le module copy, qui recopie le contenu de di ct . Cette tech- 
nique entraine done les memes limitations que Borg pour les new-style classes. 

II est possible d'implementer une methode deepcopy () dans la classe. Elle 

impactera directement le fonctionnement du decorator, ce qui peut etre relativement 
interessant pour filtrer les donnees sauvegardees pendant la transaction. 

Utilisation du decorator 

class M(object) : 

def init (self) : 

def o(): 

print ('OK') 
self. a = 12 
self.b = ['a', 32] 
self.l = o 

©transaction 
def run(self) : 

self .b.appendC c') 

self.o = 12 

self. a = '14' 

self. a += 1 

objet = M() 

try: 

objet. run() 
except TypeError: 
pass 

print(objet .a) 
print(objet.b) 
objet. 1 O 

[...] 

[tziade@Tarek Desktop] $ python memento. py 

12 

['a', 32] 

OK 
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Dans l'exemple, la methode run() modifie les attributs de l'objet et provoque une erreur 
lorsqu'elle tente d'incrementer a. La transaction assure un retour a l'etat precedent. 

Une extension interessante de ce pattern est la mise en place de l'historisation des 
transactions dans un journal : chaque etat de l'objet est sauvegarde et un retour en 
arriere illimite devient possible. Ce principe devient cependant relativement com- 
plexe lorsque plusieurs objets transactionnels sont lies entre eux. La base de donnees 
objet de Zope (ZODB) en est un exemple d'implementation . 

Chain of responsibility 



Figure 14-4 

Schema UML Chain of responsi- 
bility 



Handler 



# next handler 



- init [self , next_handler) 

+ call (self , *args,**kw) 

- add [self , next_handler) 

+_handle[self,*args,**kw) 



Director 



# first handler 



_init (self : f irst_handler) 

_call [self , *args, *kw) 



Dans le module urll i b2, presente au chapitre 9, chaque option du protocole HTTP 
est geree par une classe specifique appelee handler. Ces handlers sont chaines et 
regroupes dans une classe OpenDi rector, qui est en charge de l'ouverture de 1'UPvL. 
Cette classe passe au premier handler de la chaine la reponse du serveur, qui la traite, 
ou transmet la demande au handler suivant, jusqu'a ce qu'un handler traite la reponse 
et renvoie un resultat, ou que la fin de la chaine soit atteinte. 

Cette strategic est une implementation du DP Chain of Responsibility, et permet 
d'adapter automatiquement des situations en fonction des informations a traiter, sans 
que la classe qui recoit ces informations (le director) n'ait besoin d'avoir d'expertise : 
elle se contente de deposer les donnees sur un tapis roulant et d'attendre que les 
resultats ressortent d'une des trappes du tapis. 

Lautre avantage de cette approche est de pouvoir mettre en place un systeme de 
plug-ins, ou chaque nouvelle classe peut venir se greffer dans la chaine sans avoir a 
connaitre le contexte. 

Enfin l'ordonnancement permet de gerer des priorites entre les handlers lorsque deux 
d'entre eux sont potentiellement capables de gerer des donnees. 
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Une implementation possible de ce DP est de proposer un objet director qui imple- 
mente une interface de publication, et un objet handler, capable de fonctionner 
comme un noeud d'une liste chainee : il connait son voisin de droite, mis en place par 
le director, et peut lui transmettre le travail. 

Chain of responsibility 

class Handler (object) : 

""" classe de base d'un handler """ 

def "init (self, next_handler=None) : 

self ._next_handler = next_handler 

def add (self, next_handler) : 

""" handlerl + handler2, place handler2 en noeud voisin 
et renvoi le handler2 si self ._next_handler est pris, 
remonte la chaine. 

current_handler = self 

while current_handler._next_handler isnot None: 
current_handler = current_handler._next_handler 

current_handler._next_handler = next_handler 
return self 

def call (self, *args, **kw) : 

""" Si la classe provoque une exception NotlmplementedError , 
le prochain noeud est appele, si il existe, et ainsi de suite 

try: 

return self ._handle(*args, **kw) 
except NotlmplementedError: 

if self ._next_handler isnot None: 

return self ._next_handler(*args, **kw) 
else: 

raise NotlmplementedError 

def _handle(self , '''args, **kw) : 
""" methode a surcharger """ 
raise NotlmplementedError 

class Di rector(object) : 

""" le director est instancie avec le premier noeud de la chaine """ 

def init (self, fi rst_handler) : 

self ._fi rst_handler = fi rst_handler 

def call (self, *args, **kw) : 

return self ._fi rst_handler(*args, **kw) 
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La methode add () du handler est relativement puissante ici, car elle permet de 

construire tres simplement la chaine : quand un handler B est additionne a un han- 
dler A, A parcourt la chaine en partant de son voisin de droite pour aller placer le 
handler B en bout de chaine. 

Le chainage des appels se fait par le biais de l'exception NotlmplementedError : 
chaque handler qui ne sait pas gerer les donnees qui lui sont envoyees leve l'exception 
pour appeler le suivant. Si aucun handler ne peut gerer les donnees, l'exception sort 
de la chaine. 

Dans l'exemple ci-dessous, chaque handler est specialise dans un type de donnees. 

Utilisation de Chain of responsibility 

class StringHandler(Handler) : 
"""handler de string""" 
def _handle(self, data): 

if isinstance(data, str) : 

return data.lower() 
else: 

raise NotlmplementedError 

class IntHandler(Handler) : 
"""handler de int""" 
def _handle(self , data): 

if isinstance(data, int): 

return data * 2 
else: 

raise NotlmplementedError 

class UnicodeHandler(Handler) : 
"""handler de Unicode""" 
def _handle(self, data): 

if isinstance(data, Unicode): 

return u'%s (Unicode)' % data 
else: 

raise NotlmplementedError 

calculator = Di rector(StringHandler() + IntHandlerO + UnicodeHandlerO) 

print(calculator(l)) 
print (calculator(u' test 1 )) 
print (calculator ('test ')) 
print(calculator(object())) 

[...] 

[tziade@Tarek Desktop] $ python chain_of_responsibility .py 
2 
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line 79, in ? 



test (Unicode) 
test 

Traceback (most recent call last): 
File "chain_of_responsibility. py" 

print(calculator(object())) 
File "chain_of_responsibility. py" , line 46, 

return self ._fi rst_handler(*args, **kw) 
File "chain_of_responsibility. py" , line 32, 

return self ._next_handler(*args , **kw) 
File "chain_of_responsibility. py" , line 32, 

return self ._next_handler(*args , **kw) 
File "chain_of_responsibility. py" , line 34, 
raise NotlmplementedError 
NotlmplementedError 



i n 



i n 



_call_ 

_call_ 

_call_ 

call 



Une variante de ce DP consiste a parcourir entierement la chaine. Cette nuance est 
relativement commune dans les logiciels de traitement du signal : les filtres qui trans - 
forment les donnees peuvent etre chaines pour etre appliques les uns apres les autres. 



State 

Le DP State stipule qu'un objet deja instancie peut changer a tout moment de classe, 
et done de comportement. Cette propriete permet l'implementation d'automates a 
etat fini {Finite State Machine). 

Cette manipulation est impossible pour la plupart des langages de programmation 
objet qui definissent une bonne fois pour toutes le type d'une instance. Python est 
l'un des rares langages a le permettre car il est construit sur le principe de la 
delegation : un objet donne execute le code defini dans une classe et peut a tout 
moment executer le code d'une autre classe. Appeler i nstance . x() pour un objet de 
classe X est done equivalent al'appel de X.x (instance). 

Changement de classe d'une instance 

>» class A(object): 
def a(self): 

print('%s est passe par A' % str(self)) 

>» class B (object): 
def b(self): 

print('%s est passe par B' % str(self)) 

>» objet = A() 
>» objet. a() 

< main .A object at 0xb7c268ac> est passe par A 

>» B.b (objet) 

Traceback (most recent call last): 
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File "<stdin>", line 1, in ? 
TypeError: unbound method b() must be called with B instance as first 
argument (got A instance instead) 
>» # qu'a cela ne tienne... 

>» objet. class = B 

>» B.b(objet) 

< main .B object at 0xb7c268ac> est passe par B 

>» objet.bO 

< main .B object at 0xb7c268ac> est passe par B 

Le seul controle effectue par l'interpreteur est de verifier que l'attribut cl ass de 

l'instance corresponde a la classe traversee. II suffit done de le changer pour rendre 
l'objet compatible. 

II est cependant necessaire de prendre quelques precautions supplementaires au 
moment du changement d'etat : 

• Le constructeur de la classe doit etre appele, pour assurer l'integrite de l'etat de 
l'objet. 

• Les attributs prives de l'objet, stockes dans diet sous la forme 

_Classe_attribut, doivent etre manuellement supprimes, meme si ces residus ne 
peuvent pas en theorie poser de problemes. 

State 
class State(object) : 

def change_state(self , class_, *args, **kw) : 

""" methode de changement dynamique de classe """ 

# permet d'eviter une reinitialisation 
if self. class is class_: 

return None 

# suppression des attributs prives 

# specifiques a la classe en cours 

class_name = self. class . name 

for attribute in tuple(self. diet ): 

if attribute. startswith('_%s ' % class_name): 

del self. diet [attribute] 

# passage au nouveau type 
self. class = class_ 

# initialisation 
if hasattr(self, ' init '): 

self. init (--args, **kw) 
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D'autres DP peuvent implementer ce principe mais le gros interet de State est que 
l'objet s'auto-suffit : il nest pas necessaire ici d'implementer une classe qui orchestre 
les transitions, et suivre le code devient nettement plus simple. 

Patterns structurels 

Les patterns structurels permettent d' organiser plusieurs classes en structures, ou com- 
posants. Les patterns structurels se ressemblent generalement beaucoup car ils mettent 
tous en oeuvre des agregations ou des encapsulations, mais ils repondent chacun a des 
problemes precis, et leurs differences se creusent a l'usage, sur le code appelant : 

• utiliser Adapter permet de recombiner des relations entre classes. 

• Facade est utile pour masquer un systeme et limiter son acces. 

• Proxy quant a lui, est un intermediate entre le code et un type d'objet, et differe 
d'Adapter car il permet d'implementer une couche logique supplemental. 

Adapter 

Le DP Adapter permet d'adapter une classe pour l'utiliser dans un contexte d'execu- 
tion prevu pour d'autres classes. La classe est encapsulee dans une deuxieme classe 
(1' Adapter) qui se charge de fournir au contexte les interfaces attendues et de traduire 
en interne les appels pour qu'ils soient comprehensibles par la classe adaptee. 

Les Adapters sont de veritables liants pour la mise en place d'interactions entre com- 
posants qui n'ont pas ete prevus pour fonctionner ensemble au depart. Ils peuvent 
aussi permettre de gerer les problematiques de versions lorsque l'interface d'un com- 
posant externe evolue. On parle alors de decouplage, le code specifique au contexte 
etant restreint dans la classe d'adaptation. 

II n'existe pas d'implementation generique pour ce pattern. Le seul principe commun 
entre les Adapters est la facon dont ils sont crees : l'objet adapte est un parametre du 
constructeur de 1' Adapter. 

La classe StringlO est un bon exemple d'Adapter: elle simule le fonctionnement 
d'un objet de type file en fournissant toutes les methodes de lecture, et travaille en 
interne avec un objet de type stri ng. 

Adapter StringlO 

>» import cStringlO 

>» file = cStringIO.StringIO('contenu du fichier 1 ) 

>» file. readlines() 

['contenu du fichier'] 

>» file.seek(O) 
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>» file. read() 
'contenu du fichier' 
>» file.close() 

Stri nglO peut done etre utilise en lieu et place de tout type fichier, lorsqu'un flux de 
lecture est attendu : le code appelant ne fait pas la difference. 

Ce pattern est bien sur sensible a tous les tests effectues sur le type de classe d'un 
objet lorsque ce dernier traverse le code adapte, comme un test isinstance(objet, 
cl asse), mais ce probleme est restreint a son utilisation sur du code non maitrise et il 
reste possible de tricher en modifiant l'attribut cl ass . 

Un autre exemple d'utilisation d'Adapter est l'implementation du modele docu- 
ment-vue. En quelques mots, ce modele stipule qu'une classe qui implemente une 
certaine fonctionnalite ne doit pas, si elle est utilisee dans une interface de visualisa- 
tion, etre etendue pour fournir les methodes qui permettent de l'afficher. 

En d'autres termes, l'affichage est specifique a un type d'interface et cette logique 
doit etre decouplee de la classe car elle n'evolue pas de la meme maniere. 

Adapter, exemple 2 

class MaClasse(object) : 

def init (self) : 

self. a = 2 

self.b = 4 
def calcul(self): 

return self. a + self.b 

class InterfaceMaClasse(object) : 

def init (self, contexte) : 

self .contexte = contexte 

def afficheCalcul(self): 

resultat = self .contexte. calcul () 
print resultat 

def saisieValeurs(self) : 

a = int(raw_input('saisissez a: ')) 
b = int(raw_input('saisissez b: ')) 

if name == ' main ' : 

A = MaClasseO 

interface = InterfaceMaClasse(A) 

i nterf ace . sai si eVal eu rs () 
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i interface. afficheCalcul () 

[tziade@Tarek Desktop]! python adapter2.py 
saisissez a: 1 
saisissez a: 5 
6 

Dans cet exemple, InterfaceMaClasse implemente toute la couche d'interaction 
avec l'utilisateur : MaClasse reste independante de cette logique d'affichage. 

Facade 

Le DP Facade peut etre considere comme un Adapter multiple : lorsqu'une opera- 
tion met en oeuvre un certain nombre de classes, il peut etre interessant de masquer 
cette complexite dans une classe qui ne publie que l'operation. 

Facade n'a de sens que si la classe qui publie l'operation est correctement nommee et 
que les classes sous-jacentes ne sont pas appelees ailleurs dans le programme pour le 
meme type de besoin. Comme pour Adapter, il n'existe pas de modele generique 
particulier pour Facade. 

Dans l'exemple ci-dessous, une archive tar est construite a partir d'un fichier et de 
son empreinte MD5. Cette operation necessite i'utilisation d'un objet de type file, 
de la classe md5 du module eponyme et du module tarbal 1 . 

Facade 
class Archiveur(object) : 

def archive_fichier(self , nom) : 
# importations locales 

import md5 

import tarfile 

import os 

# creation de 1 'archive 
nom_archive = '%s.tgz' % nom 

archive = tarfile. TarFile(nom_archive, 'w') 
archive. add(nom) 

# ajout du fichier a 1 'archive 
with open(nom, 'rb') as fichier: 

# md5 

calculateur = md5.new() 
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for line in fichier: 

cal cul ateur . update(l i ne) 

empreinte = calculateur.hexdigest() 

# creation et ajout du fichier md5 
nom_empreinte = os.tmpnameO 
with open(nom_empreinte, 'w') as fichier: 
f i chi er_emprei nte .wri te(emprei nte) 

archive. add(nom_empreinte, '%s.md5' % nom) 
archive. close() 

if name == ' main ' : 

archiveur = ArchiveurO 

archi veur. a rchive_fi chi er(' memento. py ') 

Cet exemple pousse la logique jusqu'au bout puisque les importations sont aussi 
locales a l'operation : tout est masque. 

Proxy 

Le DP Proxy permet de representor et de controler tous les acces a un objet par le 
biais d'un deuxieme objet. On compte plusieurs types de proxy, dont : 

• Le Virtual Proxy, qui ne permet de gerer l'instanciation de l'objet sous-jacent que 
lorsqu'on y accede reellement. 

• Le Remote Proxy, qui permet l'acces a un objet distant. Ce proxy publie les metho- 
des de l'objet mais ajoute le protocole reseau pour echanger avec l'objet distant. 

Construits comme les Adapters, les Proxies n'ont pas a proprement parler de modele 
generique : chaque implementation depend du contexte. 

Dans l'exemple ci-dessous, le Virtual Proxy mis en oeuvre permet de manipuler des 
fichiers videos de grande taille sans avoir a les ouvrir : seules les metadonnees sont 
chargees et permettent l'utilisation du fichier. On n'accede aux donnees qu'en cas de 
necessite (methode donnees ()). 

Virtual Proxy 

import os 
import stat 

class VideoFile(object) : 

def init (self, nom): 

self. nom = nom 

self. stats = os.stat(nom) 
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if 



def derniere_modifi cation (self) : 

return self . stats [stat.ST_MTIME] 

def dernier_acces(self) : 

return self . stats [stat .ST_ATIME] 

def ta-ille(self): 

return self .stats [stat. ST_SIZE] 

def donnees(self) : 

return iter(open(self .nom)) 



fichier = VideoFileC/home/tziade/Capture.avi ') 
print('ta-ille: %d octets' % fichier. tailleO) 
print('dernier acces: %s ' % str(fichier.dernier_acces())) 

# lecture des donnees 
iterateur = fichier. donneesO 
for i in range(lO) : 

pr i nt (st r (iterateur. next ())) 



A SAVOIR Le module weakref 

Le module standard weakref permet de mettre en place des patterns equivalents a I'aide de references 
faibles vers les objets, c'est-a-dire des references qui n'empechent pas I'objet d'etre detruit. 



En un mot... 



Le principe des design patterns est de deceler des schemas recurrents de programma- 
tion pour les systematiser. 

Seuls les designs patterns les plus frequents ont ete presentes ici, et le lecteur inte- 
resse pourra se referer, en complement du livre du GoF, a Pattern-oriented Software 
Architecture, a system of patterns (Buschmann, Meunier, Rohnert, Sommerlad, Stal 
aux Editions Wiley) pour y retrouver d'autres exemples et les porter a Python. 



A 



L'histoire de Python 



Le langage Python a ete cree a la fin des annees 1980 a l'lnstitut national de recher- 
ches mathematiques et informatiques de Hollande (le CWI) par Guido van Rossum. 
Par commodite, nous utiliserons le raccourci GvR pour nommer ce dernier dans la 
suite de cette annexe. 



Le langage ABC 



GvR a rejoint le CWI en 1983 dans l'equipe en charge du developpement du langage 
ABC, sur lequel il a travaille pendant 3 ans. Cette periode a fortement influence 
GvR sur la conception de Python, qui herite de certains des concepts d'ABC. 

Le langage ABC est un langage de programmation interactif fortement type, qui a 
ete pense pour remplacer le Basic, largement repandu a l'epoque, en fournissant un 
environnement particulier ainsi que d'autres caracteristiques notables, comme le 
typage specifique des donnees et la syntaxe par indentation. 

Environnement de developpement 

La particularite de l'environnement dABC est qu'il n'est pas necessaire de sauve- 
garder fonctions et procedures dans des fichiers sources : une fois entrees dans l'envi- 
ronnement interactif, leur saisie dans l'invite de commande (le prompt, symbolise 
sous ABC par >») les conservent automatiquement d'une execution a l'autre. 
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Un systeme de completion de code permet en outre de faciliter la saisie des com- 
mandes. Enfin, un historique autorise de revenir en arriere sans limite. 

Types de donnees 

ABC fournit 5 types, qui permettent d'exprimer toutes formes de structures de 
donnees : 

• le type nombre, pour les entiers et les reels, sans aucune limite de taille, hormis la 
memoire physique disponible de la machine ; 

• le type text, pour les chaines de caracteres ; 

• le type list, pour manipuler des collections d'elements ordonnes ; 

• le type compound, equivalent au type 1 i st mais non modifiable. C'est une sorte de 
recordset sans etiquette ; 

• le type tab! e, qui definit un certain nombre de cles uniques, et associe une valeur 
a chacune d'entre elles. Ce type est comparable a une combinaison de deux ins- 
tances de type list: les cles et les valeurs. 

Exemple de manipulation de table sous ABC 

>» PUT {} IN distance_paris 

>» PUT 300 IN distance_paris ["Dijon"] 

>» PUT 220 IN distance_paris["Lille"] 

>» PUT 770 IN distance_paris ["Marseille"] 

>» WRITE distance_paris ["Dijon"] 

300 

>» WRITE distance_paris 

{["Dijon"]: 300; ["Lille"]: 220; ["Marseille"]: 770} 

II n'est pas necessaire ici de signaler que la variable distance_paris est de type 
tabl e, ABC le fait automatiquement lors de la premiere affectation. 

Indentation du code 

L'imbrication de code ABC n'est pas faite comme en C ou en Pascal par des acco- 
lades ou des delimiteurs begin, .end. C'est l'indentation des lignes qui determine le 
niveau d'imbrication du code. 

Exemple de definition de la fonction message 

HOW TO DISPLAY message: 
FOR line IN message: 
WRITE line / 
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>» DISPLAY "ABC est "Tancetre de Python" 
ABC est "Tancetre de Python 



En savoir plus Le langage ABC 

Pour plus d'informations sur le langage ABC, Le lecteur interesse peut se referer a I'ouvrage The ABC 
Programmer's Handbook (Geurts, Meertens, Pemberton, aux Editions Prentice-Hall). 



Le projet ABC n'a malheureusement pas eu le succes escompte en dehors du cercle 
du CWI et est reste relativement confidentiel. 



Le projet Amoeba 

GvR a rejoint en 1986 le projet Amoeba, un systeme d'exploitation distribue. II a ete 
charge dans ce cadre de creer un langage de script pour manipuler le systeme plus 
facilement. Les contraintes du projet etaient relativement souples pour laisser GvR, 
fort de son experience passee, mettre au point une premiere version de ce qui allait 
devenir le langage Python. 

GvR implementa ce langage de script en essayant de supprimer toutes les contraintes 
et frustrations qu'il avait vecues avec ABC. 

Par exemple, ABC ne permettait pas de lire et ecrire dans un fichier, et cette fonc- 
tionnalite ne pouvait pas etre ajoutee facilement au langage, denue de tout concept 
de bibliotheque ou de tout systeme de programmation d'entree/sortie souple. 

L'extensibilite fut le premier chantier de GvR car il voulait que Python, meme si son 
objectif premier etait de fonctionner pour Amoeba, puisse etre etendu facilement par 
des programmeurs tiers en se basant sur un socle commun de primitives et des points 
d'entree simples. 

L'idee de rendre le langage portable, c'est-a-dire fonctionnel sur plusieurs 
plates-formes comme Amoeba bien sur, mais aussi sur MS-Windows, Unix ou Mac- 
intosh, etait aussi un objectif de GvR. 

A un moment de l'histoire de l'informatique ou les ordinateurs commencaient a 
envahir les entreprises et les foyers, le manque d'extensibilite et de portabilite con- 
damnait ABC a un role mineur, et GvR, en visionnaire, a su ouvrir les portes de son 
langage de script. 

GvR concut les premieres versions du langage qu'il appela Python, a la gloire des 
Monty Python dont il etait fan. Lorsque la liste de diffusion fut creee plus tard, il 
n' etait pas rare de voir regulierement des messages de fans des Monty Python, ne 
pensant pas avoir affaire a un langage de programmation. 
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Dans les premieres versions du langage, le systeme d'extension qui permettait 
d'ajouter de nouveaux types d'objets a Python a partir d'un fichier de code Python ou 
un fichier compile en C, C++ ou encore en Fortran, a tout de suite ete adopte et ple- 
biscite par l'entourage de GvR. 

Les versions de Python s'enchainerent jusqu'a la version 1.2 en 1995, date a laquelle 
GvR quitta le CIW pour rejoindre le CNPJ (Corporation of National Research Ini- 
tiatives) a Reston en Virginie (USA) pour continuer ses travaux. 



Le CNRI 

Cet organisme financa le developpement de Python pendant cinq ans, par le biais de 
fonds de recherche. La Python Software Activity (PSA), le Python Consortium et des 
societes privees apporterent egalement des fonds pour soutenir l'avancee du langage. 
Le travail au CNRI a permis de sortir plusieurs versions de Python, de la 1.3 a la 1.6. 

En 2000, GvR prit la decision de quitter le CNRI, car les fonds alloues a Python 
etaient de plus en plus maigres et les developpeurs dispatches sur d'autres projets. De 
plus, l'organisme ne semblait pas tres favorable au logiciel libre. 

Ce depart fut relativement tendu et le CNRI insista pour modifier le texte de la 
licence de Python pour garder une mainmise, en provoquant a l'epoque une grande 
inquietude de la communaute sur la suite des evenements. 

Accompagne de 3 autres developpeurs du CNRI, GvR fonda le PythonLabs, et 
rejoignit la startup Californienne BeOpen.com. 



PythonLabs et BeOpen.com 

Avec l'arrivee a BeOpen.com, l'equipe du PythonLabs passa directement de la ver- 
sion 1.6 a la 2.0, en integrant des ameliorations majeures, comme les list comprehen- 
sions, le support etendu du XML, un nouveau systeme de ramasse-miettes cyclique, 
et une nouvelle licence plus orientee Open Source. 

Le projet Python 3000 etait lance en parallele, pour accueillir la nouvelle version de 
Python, vouee a contenir des modifications incompatibles avec les versions 2.x, pour 
corriger des erreurs de conception du langage. 

Un systeme d'avertissement a alors ete introduit pour permettre de specifier les com- 
patibilites ascendantes et descendantes du langage. 
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En d'autres termes, toute introduction de nouvelle fonctionnalite incompatible avec 

la version en cours, peut etre apercue et utilisee par le biais du module future , et 

toute fonctionnalite qui n'existera plus dans la version suivante affiche un warning 
lorsqu'elle est utilisee. 

Ce systeme est d'ores et deja utilise dans la serie des versions 2.x. 



Python Software Foundation et Digital Creations 

Moins d'un an apres l'arrivee a BeOpen.com, l'equipe de PythonLabs demenage une 
nouvelle fois pour rejoindre Digital Creation, la societe qui allait devenir par la suite 
Zope Corp. 

En Mars 2001, la Python Software Foundation voit le jour et remplace la PSA, 
annoncee par GvR a la neuvieme conference Python, et sponsorisee par les societes 
Digital Creation et ActiveState, contributeurs majeurs de la communaute Python de 
l'epoque. 

Le premier comite directeur reunissait des membres de PythonLabs et des responsa- 
bles des deux societes, a savoir : Dick Hardt, David Ascher, Paul Everitt, Fredrik 
Lundh, Tim Peters, Greg Stein, Guido van Rossum et Thomas Wouters. 

Les versions de Python se sont ensuite enchainees jusqu'a la toute derniere en 2009 
au moment de l'ecriture de ce livre (3.0). 



Python et Zope 

Python a joue un role fondamental pour le developpement du framework Zope, et 
inversement, Zope a beaucoup contribue au developpement du langage. 

Le texte ci-dessous est une interview de Paul Everitt, createur de Digital Creations, 
l'entreprise qui concoit Zope, et qui repond a la question suivante : 

Quelle a ete la place de Python dans l'histoire de Zope et Digital Creations ? 

En 1995, la societe Digital Creations a ete creee pour mettre en ligne des journaux. 
Nous avons utilise Python pour concevoir l'architecture de notre plate-forme de 
journaux en ligne et avons beaucoup participe a la communaute Python. 

Jim Fulton (ndlr : directeur technique actuel) a rejoint l'entreprise l'annee suivante et 
a lance l'idee de publier des objets Python via le Web. Le framework « Bobo » etait 
ne et distribue sous licence Open Source. 
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Une application commerciale nommee Principia et entierement ecrite en Python fai- 
sait egalement partie de nos travaux. 

En 1997, nous avons ete sortis du consortium des journaux et conserve la propriete 
intellectuelle. En 1998, Hadar Pedhazur a investi dans l'entreprise, et nous avons 
concentre nos travaux Python, dans un seul et meme produit Open Source : Zope. 
Une large communaute de developpeurs pour la plupart issus de l'Open Source s'est 
construite autour du projet. 

Python etait dans notre sang des le depart. Jim et moi sommes alles a la toute pre- 
miere conference Python publique (20 personnes). Jim etait alors considere comme 
un, sinon le principal contributeur du noyau du langage Python. 

Grace a Python, nous etions capables de construire des systemes web, comme des 
systemes de petites annonces electroniques tres dynamiques en un temps record, ce 
qui nous rendait tres competitifs. 

Parallelement, lorsque nous avons concu Principia, le serveur d'applications proprie- 
taire, nous avions decide de cacher Python. Cette decision a eu un enorme impact 
aussi bien positif que negatif, sur le fonctionnement de Zope. Les idees de gerer tout 
un site a travers des interfaces d'administration en ligne, de stocker des portions de 
code restreint dans une base de donnees (ndlr : la ZODB), et d'etendre le serveur par 
des paquets d'extension, vinrent de cette decision. 

Nous avons aussi apporte une nouvelle audience pour le langage Python, puisque 
beaucoup de gens qui choisissaient Zope, havaient jamais fait de Python auparavant 
(a la premiere conference Zope a l'ICP8, la moitie de l'audience n'avait jamais utilise 
Python avant Zope). 

Malheureusement le choix de cacher Python a egalement genere une confusion sur 
ce qu' etait Zope. La communaute Python jugeait Zope 2 comme un framework pas 
tres Pythonique. De plus, Zope 2 lui-meme vivait une crise d'identite : etait-ce un 
produit destine aux integrateurs, ou un produit oriente developpeur ? 

Zope 3 a resolument pris un tournant en orientant le framework vers un outil pour 
developpeurs. 

Des journalistes comme Jon Udell ou Edd Dumbill considerent que Zope est l'un 
des frameworks ou l'Open Source a reellement vecu des innovations, pour la plupart 
issues des idees de Jim Fulton. Le langage Python influenca beaucoup Jim dans ses 
idees, et offrit a Zope des fonctionnalites magnifiques : l'idee de publier des objets 
sur le Web est devenu un sujet informatique d'actualite, 9 ans apres que Jim Fait fait. 

Une base de donnees transactionnelle distribuee d'objets Python, utilisee dans des 
sites commerciaux enormes, c'est un resultat impressionnant. Lhistoire de Zope et 
Python est maintenant vieille de 10 ans. Place maintenant a un nouveau chapitre : 
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Zope 3 et son souhait d'etre plus pythonique que son predecesseur et d'interesser 
d'avantage la communaute Python. 

— Paul Everitt, fondateur de Digital Creations. 



BLOG L'histoire continue... 

II y a quelque temps, Guido van Rossum a initie un blog dedie a l'histoire de Python. II contient beaucoup 
plus de details que cette annexe. Un blog a surveiller done, pour etre au fait des demiers evenements lies 
au langage. 
► http://python-history.blogspot.com/ 



B 



Bibliotheques tierces 



La philosophic Batteries Included de Python rencontre ses limites lorsque des fonc- 
tionnalites tres specifiques sont recherchees. Cette limitation n'est cependant pas 
bloquante grace a la facilite d'extension du langage : il est possible de trouver des 
bibliotheques tierces pour la quasi-totalite des besoins. 

D'autre part, certains modules initialement presents dans la bibliotheque standard 
ont ete volontairement delaisses au fur et a mesure des versions du langage, pour pre- 
ferer des solutions externes. 

Cette annexe liste un certain nombre de bibliotheques externes, les plus frequem- 
ment utilisees, organisees par themes : 

• bases de donnees ; 

• traitement de texte ; 

• packaging, distribution ; 

• tests fonctionnels et controle qualite ; 

• MS-Windows ; 

• interfaces graphiques ; 

• reporting et conversion ; 

• jeux et 3D ; 

• audio et video ; 

• bibliotheques scientifiques ; 

• Web. 
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Chacune des bibliotheques est presentee par un court texte et une URL suit le meme 
schema d'installation, presente ci-apres. 



Installer une bibliotheque externe 



L'ensemble des bibliotheques externes presentees dans cette annexe sont tres simples 
a installer car basees sur le module distutils, presente au chapitre 13. Ces biblio- 
theques externes sont souvent livrees dans un fichier compresse sous la forme 
NomDuPaquet-versi on . zi p ou NomDuPaquet-versi on . tar . gz. 

Installer une extension se fait en trois etapes : 

1 decompression du paquet, par l'outil tar ou equivalent ; 

2 construction du paquet dans le repertoire de decompression, par l'option build 
du script setup. py ; 

3 installation du paquet dans Python, par l'option i nstal 1 du script setup . py. 

Lorsque la premiere etape est effectuee, on retrouve dans le repertoire decompresse 
une structure commune a toutes ces bibliotheques, a savoir : 

• Un fichier setup. py, qui contient la configuration et l'appel au framework 
distutils. 

• Un fichier setup. cfg, optionnellement present, qui contient des informations 
supplementaires, lorsqu'une compilation est necessaire. 

• Des informations sur 1' extension, contenues dans les fichiers INSTALL et README. 

• Une certain nombre de fichiers source. 

La construction du paquet prepare un sous-repertoire build qui contient les ele- 
ments a fournir a Python. 

Enfin, la derniere etape recopie ces fichiers dans le repertoire site-packages de 
l'installation de Python. Elle peut done necessiter les droits d'administrateur. 

Installation de Ixml 

$ tar -xzf 1 xml -0 . 7 . tgz 

$ cd lxml 

$ python setup. py build 

running build 

running build_py 

creating build 

creating build/lib.linux-i686-2 .4 

creating build/lib.linux-i686-2 .4/1 xml 

creating build/lib.linux-i686-2 .4/1 xml /tests 
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$ sudo python setup. py install 

running install 

running build 

running build_py 

running build_ext 

running install_lib 

creati ng /usr/1 i b/python2 . 4/si te- packages/1 xml 

creating /usr/lib/python2 . 4/si te- packages/1 xml /tests 

copying build/lib. linux-i686-2 .4/lxml/tests/test_etree.py -> /usr/lib/ 

python2 . 4/si te-packages/1 xml /tests 

Une fois 1'installation effectuee, le nouveau module doit etre disponible dans le 
prompt. 

Verification de 1'installation 

tzi ade@Tarek : /home/packages/1 xml $ python 

Python 2.4.1 (#2, Mar 30 2005, 21:51:10) 

[CCC 3.3.5 (Debian 1: 3 . 3. 5-8ubuntu2)] on linux2 

Type "help", "copyright", "credits" or "license" for more information. 

>» import lxml 

>» 



A SAVOIR Controler la bonne installation d'une bibliotheque 

Certaines bibliotheques fournissent des tests (souvent bases sur le framework pyUni t) qui peuvent etre 
lances pour verifier que 1'installation est correcte et que tout fonctionne comme prevu. 



Lorsque le paquet est disponible sur PyPI, il est possible d'utiliser setuptool s ou pi p 
pour proceder a une installation automatique. 

Utilisation de setuptools 

setuptool s est une bibliotheque tierce qui fournit des fonctionnalites au-dessus de 
di stuti 1 s, dont un script d'installation de paquets disponibles sur PyPI. 



► http://peak.telecommunity.com/DevCenter/setuptools 



Son installation est simplified par un script appele ez_setup . py, disponible sur le site 
du projet setuptools, al'adresse : http://peak.telecommunity.com/dist/ez_setup.py. 
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Installation de setuptools 

$ wget http://peak.telecommunity.com/dist/ez_setup.py 

--2009-03-05 23: 12 : 12-- http://peak.telecommunity.com/dist/ez_setup.py 

Resolution de peak.telecommunity.com... 209.190.5.234 

Connexion vers peak. telecommunity. com | 209.190. 5.234 | :80. . . connecte. 

requete HTTP transmise, en attente de la reponse. . .200 OK 

Longueur: 9716 (9,5K) [text/plain] 

Saving to: ~ez_setup.py ' 



100% [===================================>] 9 . 716 



35,OK/s in 0,3s 



2009-03-05 23:12:12 (35,0 KB/s) - « ez_setup.py » sauvegarde [9716/9716] 

$ python ez_setup.py -U setuptools 

Searching for setuptools 

Reading http://pypi . python .org/simple/setuptools/ 

Best match: setuptools 0.6c9 

Processing setuptools-0.6c9-py2 .6. egg 

setuptools 0.6c9 is already the active version in easy-install .pth 

Installing easy_install script to /Library/Frameworks/Python .framework/ 

Versions/2. 6/bin 

Installing easy_install-2 .6 script to /Library/Frameworks/ 

Python . f ramework/Versions/2 . 6/bi n 

Using /Library/Frameworks/Python . f ramework/Versions/2 .6/lib/python2 .6/ 
site- packages/set uptools-0.6c9-py 2 .6. egg 
Processing dependencies for setuptools 
Finished processing dependencies for setuptools 

Une fois setuptools installe, une nouvelle commande appelee easy_install estdis- 
ponible. Elle installe tout paquet disponible sur PyPi, grace a son nom. 

Installation de BeautifulSoup avec easy_install 



$ easy_install BeautifulSoup 

Searching for BeautifulSoup 

Reading http://pypi . python .org/simple/BeautifulSoup/ 

Readi ng http : //www. crummy . com/sof tware/Beauti f ul Soup/ 

Readi ng http : //www. crummy . com/sof tware/Beauti f ul Soup/downl oad/ 

Best match: BeautifulSoup 3.1.0.1 

Downl oadi ng http : //www. crummy . com/sof tware/Beauti f ul Soup/downl oad/ 

Beautiful Soup- 3. 1.0. l.tar.gz 

Processing Beautiful Soup- 3 .1.0. l.tar.gz 
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Bases de donnees 

Python fournit les briques de base (DBAPI) a tout type de connecteur de base de 
donnees et propose quelques modules d'acces a des formats ultra standards comme 
BerkeleyDB. Cependant, aucun connecteur aux SGBD courants n'est integre dans la 
bibliotheque standard. 

Toutes les bases de donnees du marche peuvent etre bien evidemment attaquees 
depuis Python, et cette section presente les connecteurs les plus courants. Elle inclut 
egalement un connecteur LDAP et un ORM. 



Gadfly 



Code en Python, Gadfly est un mini-systeme SGBD complet. L'installation de cette 
extension permet de creer des fichiers de stockage qui peuvent etre manipules via le 
langage SQL, en mode direct ou en mode client-serveur. 

Gadfly supporte une charge relativement limitee et est en general utilise pour le pro- 
totypage d'applications client-serveur : la norme DBAPI etant respectee, ce connec- 
teur peut etre facilement interchange sans modification de code. 



► http://gadfly.sourceforge.net/ 



pysqlite 



pysqlite est un connecteur compatible DBAPI vers le systeme SQLite. Ce systeme 
leger de SGBD (non client-serveur) est de plus en plus prise dans les applications qui 
ont des besoins de stockage simples et un acces unique aux donnees, comme les 
applications web. sqlite est parfois plus rapide que les SGBD client-serveur classi- 
ques. 



► http://initd.org/tracker/pysqlite 



mysql-python 

mysql-python est un connecteur vers le celebre SGBD MySQL. 



► http://sourceforge.net/projects/mysql-python 
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psycopg 

Connecteur pour PostgreSQL. 



► http://initd.org/projects/psycopg1 



ODBC 



Certaines bases de donnees sous MS-Windows peuvent etre accedees par le biais de 
l'ODBC (Open DataBase Connectivity). La bibliotheque Python Win32 Exten- 
sions fournit un certain nombre de modules dedies a MS-Windows, dont le module 
ODBC. 



► http://www.python.org/windows/win32/ 



python-ldap 



python-ldap expose les API de OpenLDAP 2.x et quelques utilitaires annexes (lec- 
tures LDIF). Cette bibliotheque permet d'utiliser tout type de serveur compatible 
avec le standard LDAP (OpenLDAP, ActiveDirectory, etc.). 



► http://python-ldap.sourceforge.net/ 



SQLAlchemy 



SQLAlchemy est un ORM {Object-Relational Mapper) tres utilise dans la commu- 
naute. Un ORM permet de manipuler une base de donnees a travers des objets 
Python. 



► http://www.sqlalchemy.org 



Traitement de texte 

Le besoin le plus frequent en traitement de texte est la gestion du format XML. La 
bibliotheque standard propose des modules dedies mais qui sont de plus en plus 
delaisses par les developpeurs, en raison de problemes de performances et surtout par 
un manque cruel de simplicite : manipuler un fichier XML avec ces modules neces- 



lxml 
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site un effort relativement important pour un developpeur Python, habitue a plus de 
concision et de simplicite ou ne fournit pas de performances correctes. 

Cette section presente une extension dediee au traitement du XML, plus perfor- 
mante et naturelle a utiliser car basee sur le principe des curseurs : lxml. 

Un autre besoin recurrent est le traitement de fichiers HTML non stricts : ce type de 
format n'est pas lisible par des bibliotheques XML et doit etre traite specifiquement. 
Lextension BeautifulSoup propose un outil specialise. 



lxml est un bind Python code en Pyrex de "libxml et "libxslt qui fournit les memes 
API qu'ElementTree. Tres rapide, pythonique et puissante, probablement la 
meilleure bibliotheque XML actuelle. 



► http://codespeak.net/lxml/ 



Beautiful Soup 



Lorsqu'il s'agit de lire du contenu HTML non strict, le developpeur utilise en 
general les modules HTMLParser ou SGMLParser de la bibliotheque standard, ou dans 
certains cas, scrute le contenu avec une expression reguliere. 

Beautiful Soup propose une alternative interessante en scrutant le texte a la recherche 
de balises, parametres ou contenu. 



► http://www.crummy.com/software/BeautifulSoup/ 



Packaging, distribution 

Outre l'outil standard di stuti 1 s, il existe une extension de plus en plus utilisee pour 
la distribution de programmes Python, a savoir zc . bun 1 dout. 

zc.buildout est un outil qui installe un environnement de bibliotheques tierces en 
se basant sur un fichier de configuration et setuptools. 



► http://pypi.python.org/pypi/zc.buildout 
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Tests fonctionnels et controle qualite 



Twill 



En matiere de tests, les modules unittest et doctest couvrent tous les besoins basi- 
ques mais ne permettent pas de mettre en oeuvre facilement des tests fonctionnels, 
qui restent specifiques au type d'interface de l'applicatif. 

Les extensions qui offrent un environnement de developpement de tests fonction- 
nels, que ce soit pour des applications web ou desktop, fonctionnent toutes sur le 
meme principe : elles mettent en ceuvre un pont entre les tests et l'interface utilisa- 
teur. Twill et Funkload permettent de tester des applications web et guitest des 
applications GTK. Enfin, PyLint et PyFlakes offrent de bons garde-fous, comple- 
mentaires aux tests, pour s' assurer de la qualite du code ecrit. 



Twill fournit un langage de script simple qui teste une application web via des scripts 
Python. L'outil effectue des requetes vers le serveur web et analyse les resultats. 



► http://www.idyll.org/%7Et/www-tools/twill.html 



Funkload 



Funkload est un outil base sur webunit, qui ecrit des tests fonctionnels en Python. 
Cet outil permet egalement de tester la montee en charge et genere des rapports 
complets. Les tests peuvent etre concus facilement via le navigateur grace a 
TCPWatch. 



► http://funkload.nuxeo.org/ 



guitest 



Cet outil fournit des classes de base pour effectuer des tests unitaires sur des applica- 
tions PyGtk. 



► http://gintas.pov.lt/guitest/ 
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PyLint 



PyLint est un outil qui teste le code a la recherche d'erreurs ou de signes de mauvaise 
qualite. Ce programme est facilement configurable et extensible. II est comparable a 
PyChecker mais propose plus de tests. 



► http://www.logilab.org/projects/pylint 



Pyflakes 



Cet outil controle le code a la recherche d'erreurs, de code mort (impossible a 
appeler) ou de directives d'importation inutiles. Contrairement a PyChecker, cet 
outil n' execute pas le code teste, ce qui le rend plus rapide et plus securise. 



► http://divmod.org/projects/pyflakes 



MS-Windows 



II existe des bibliotheques specialises dans la programmation sur plate-forme 
MS-Windows et la technologie COM/ActiveX, a savoir les bibliotheques Win32 
Extensions etwin32com. 



Win32 Extensions 



La bibliotheque wi n32 presentee dans la section base de donnees pour l'ODBC, con- 
tient egalement des modules pour : 

• les API Win32 (un fichier d'aide Wi nHel p avec la liste des methodes est fourni) ; 

• les services NT ; 

• les Memory Mapped Files ; 

• les API win32pipe et Win32 ; 

• Les timers Win32, etc. 



► http://www.python.org/windows/win32/ 
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win32com 

wi n 32 com sert a programmer des clients ou des serveurs COM/ ActiveX. 



► http://www.python.org/windows/win32com/ 



Interfaces graphiques 



II existe plusieurs toolkits graphiques qui peuvent etre utilises par le biais de biblio- 
theques Python, pour remplacer Tkinter. Les plus repandus sont wxPython, PyQT et 
PyCTK. 



wxPython 



wxPython est une bibliotheque d'acces au toolkit wxWidgets , qui est de loin le plus 
portable des systemes d'interface. II existe en outre des outils de conception d'inter- 
faces qui generent du code Python compatible avec wxPython, comme wxGlade. 



► http://www.wxpython.org/ 



PyQT 



PyQT est un bind vers le toolkit graphique Qt de Trolltech. II offre un acces a des 
widgets tres avances, comme le controle texte Qscintilla, utilise par certains editeurs 
comme Eric3. En outre, QT designer est l'un des plus puissants editeurs pour la con- 
ception d'interfaces graphiques. Attention cependant aux licences en fonction des cas 
d'utilisation, et des plates-formes. 



► http://www.riverbankcomputing.co.uk/pyqt/ 



PyGTK 



PyGTK fournit un lien entre Python et le toolkit GTK+ (Gimp toolkit), utilise par 
l'environnement Gnome. L'outil Glade peut etre utilise pour concevoir des interfaces 
GTK et presente la meme interface que wxGlade (qui s'en inspire). 



► http://www.pygtk.org/ 
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Reporting et conversion 



En termes de reporting, il existe une bibliotheque Open Source incontournable 
nommee ReportLab editee par la societe eponyme. Elle genere des documents PDF 
et possede des fonctionnalites tres puissantes. 

RML2PDF est un outil de conversion du format RML vers PDF. rest2web est une 
bibliotheque de creation de sites web statiques generes a partir de fichiers ecrits au 
format reStructuredText. 



ReportLab 



Le toolkit ReportLab sert a concevoir en Python des systemes de generation de PDF 
et fournit : 

• un moteur de mise en page, Platypus ; 

• une librairie etendue de widgets et de formes ; 

• des points d'entree pour toutes sources de donnees, etc. 



► http://www.reportlab.org/rl_toolkit.html 



RML2PDF 



Le format Report Markup Language (RML) cree par la societe ReportLab definit 
simplement un document dans un fichier de description XML. Un outil de conver- 
sion, nomme RML2PDF se charge ensuite de le convertir en PDF. Cet outil est 
payant, mais il existe une variante Open Source editee par Tiny ERP 



► http://openreport.tiny.be/index.py/static/page/trml2pdf 



reStructuredText 



reStructuredText est un format texte tres utilise pour la documentation de projets 
Python et pour l'ecriture des docstrings des modules de code. II introduit une syntaxe 
tres simple qui permet la mise en page de texte. 

Ce format est egalement tres utilise dans les systemes wikiwikiweb, pour offrir aux 
utilisateurs un format simple a ecrire et aussi riche que le HTML. II est facilement 
convertible en rendu HTML par des outils comme rest2html. 



► http://docutils.sourceforge.net/rst.html 
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rest2web 



rest2web permet de generer des pages HTML statiques a partir de documents ecrits 
au format reStructuredText. 



► http://www.voidspace.org.uk/python/rest2web/ 



Jeux et 3D 



En termes de programmation de jeux et plus generalement de scenes 3D, Python est 
un langage de script de choix. Les toolkits Pygame et Soya 3D permettent de benefi- 
cier de la puissance de Python dans ce domaine. 

VPython propose, quant a lui, un environnement de programmation 3D temps reel 
propice a 1' etude de la modelisation. 

II est aussi possible de programmer en plus bas niveau en accedant directement aux 
bibliotheques 3D par le biais par exemple de PyOpenGL. 



Pygame 



Pygame fournit des modules d'extension pour la programmation de jeux 3D et de 
programmes multimedias, bases sur la bibliotheque SDL (Simple DirectMedia 
Layer). 



► http://www.pygame.org/ 



Soya 3D 



Soya 3D est un moteur 3D pour Python, ecrit en Pyrex et dote de toutes les fonc- 
tionnalites d'un moteur professionnel. 



► http://home.gna.org/oomadness/fr/soya/ 



vpython 



vpython propose un environnement de programmation 3D complet, en fournissant 
sa propre version d'IDLE qui permet de programmer et d'animer interactivement 
des scenes 3D. Tres pratique pour l'apprentissage de la mecanique. 
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► http://vpython.org/ 



PyOpenGL 

Module d'extension offrant Faeces aux API d'OpenGL depuis Python. 



► http://pyopengl.sourceforge.net/ 



Audio et Video 

Le domaine multimedia n'est pas en reste grace a des bibliotheques tres completes 
comme PyMedia ou des modules specifiques comme PyAlsa. 

PyMedia 

PyMedia propose un ensemble de modules pour manipuler tous les types de formats 
audio et video (mp3, ogg, avi, mpeg, etc.), modifier les echantillons par quelques fil- 
tres et piloter le materiel. 



► http://pymedia.org/ 



PyAlsa 

PyAlsa est un wrapper pour le systeme ALSA {Advanced Linux Sound Architecture) 



► http://respyre.org/pyalsa.html 



Bibliotheques scientifiques 

Cette section regroupe differentes bibliotheques scientifiques specialises dans les 
calculs numeriques comme Numerical Python et SciPy, et dans les outils dedies a des 
domaines particuliers comme Biopython. 
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Numerical Python 



Numerical Python, qui se nomme maintenant SciPy, est une bibliotheque puissante 
de fonctions de manipulation de matrices, de transformees de Fourier, et autres utili- 
taires de calcul. 



► http://sourceforge.net/projects/numpy 



SciPy 



SciPy complete Numerical Python en fournissant des fonctions de calculs statisti- 
ques, des modules de lecture et d'ecriture de matrices au format Matrix Market, etc. 



► http://www.scipy.org/ 



Biopython 

Ce projet regroupe un ensemble de modules specialises dans la biologie moleculaire. 



► http://biopython.org 



Web 



Pour terminer, void une liste de frameworks de programmation web, qui proposent 
des fonctionnalites plus ou moins evoluees : 

• Zope : http://www.zope.org 

• Quixote : http://www.mems-exchange.org/software/quixote/ 

• CherryPy : http://www.cherrypy.org/ 

• Django : http://www.djangoproject.com/ 

• Turbogears : http://www.turbogears.org/ 

• Pylons : http://pylonshq.com/ 



c 



Sites, flux RSS, 
blogs et autres friandises... 



Cette annexe presente une liste de liens de la planete Python, regroupes en trois 
categories : 

• les sites web ; 

• les flux rss ; 

• les blogs (flux rss nominatifs). 

Chaque lien, qui peut etre en anglais ou en francais, est commente. 



Flux RSS 



EN Daily Python-URL! : le flux RSS du langage Python, gere par Fredrik Lundh et, 
soutenu par Secret Labs AB (Pythonware). 



► http://effbot.org 



Ce flux, mis a jour quotidiennement, est un veritable travail editorial, mene par un 
core developer du langage et qui contient une selection des meilleures nouvelles de la 
planete Python. 



► http://www.pythonware.com/daily/ 
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EN Unofficial Planet Python : 1' autre flux RSS majeur. Cette deuxieme source 
d'informations n'est pas une selection qualitative comme Daily Python-URL mais 
propose un agregateur de flux ; il reste necessaire de faire le tri. 



► http://www.planetpython.org/rss20.xml 



EN PyPI recent updates : le flux des mises a jour des bibliotheques de PyPI. Garder 
un oeil sur ce flux peut permettre de decouvrir de nouveaux outils ou de surveiller cer- 
tains modules. 



► http://www. python. org/pypi?%3Aaction=rss 



EN Recipes from the Python Cookbook : le flux des recettes Python saisies dans le 
CookBook du site ASPN. Une lecture saine et benefique. 



► http://code.activestate.com/feeds/langs/python/ 



FR Planete Python Francophone : Le site de l'association francophone Python. 



► http://www.afpy.org/planet/ 



II existe evidemment beaucoup d'autres flux, mais les liens fournis ci-dessus generent 
les informations les plus interessantes, et produisent entre 50 et 100 nouvelles par 
jour, ce qui est plus que suffisant. 



Blogs 



EN Guido van Rossum's Weblog : GvR bloggue relativement rarement, mais il est 
important de l'avoir dans ses marqueurs. 



► http://neopythonic.blogspot.com/ 
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EN Agile Testing : le blog de Grig Gheorghiu, membre de l'alliance agile, qui parle 
quasiment exclusivement des outils de tests pour Python. 



► http://agiletesting.blogspot.com/atom.xml 



Sites 



FR Programmation Python : le site personnel de l'auteur, qui regroupe des elements 
relatifs a ce livre et des informations Python. 



► http://programmation-python.org 



EN Site officiel de Python : sans commentaires, la reference. 



► http://www.python.org 



FR Site de 1' Association Francophone Python (AFPY) : site communautaire avec des 
nouvelles, des tutoriaux Python et Zope, des forums, etc. 



► http://www.afpy.org 



Et enfin, pour quelque chose de completement different, et afin de reprendre une 
activite intellectuelle saine apres la lecture de ce livre, l'incontournable site des 
Monty Python : 



► http://www.pythonline.com/ 
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Pro grammation 

Python 

Choisi par Google comme I'un de ses langages piliers et utilise dans des projets d'envergure tels que YouTube, 
Python est omnipresent dans les applications web modernes. Open Source et portable, sa modularity et son 
orientation objet permettent de creer des applications de toutes tailles, generiques et maintenables. 

Python : de la syntaxe a ('optimisation 

Python est tout indique pour le developpement d'applications web : serveurs de contenu, moteurs de recherche, agents 
intelligents, objets distribues... II est egalement performant pour realiser des scripts d'administration systeme ou 
d'analyse de fichiers textuels, pour gerer faeces a des bases de donnees, pour servir de langage glu entre plusieurs 
applications, realiser des applications graphiques classiques, etc. 

Pour autant, le developpeur n'exploitera vraiment sa puissance qu'en ayant acquis une certaine culture. C'est ce 
que ce livre permet d'acquerir par la description de techniques eprouvees dans tous les grands projets de deve- 
loppement en Python. Au-dela de la prise en main (installation des environnements d'execution et de developpement, 
rappels de syntaxe avec les primitives et la bibliotheque standard), cet ouvrage aborde les bonnes pratiques de 
developpement Python, depuis les conventions de nommage et les design patterns objet les plus courants jusqu'a 
la programmation dirigee par les tests et I'optimisation de code. 

Enrichie en nouveaux cas pratiques et exercices, cette edition mise a jour pour Python 2.6 detaille egalement le 
script de migration 2to3 vers Python 3 et presente la bibliotheque ctypes qui permet de manipuler les structures 
de donnees en C/C++. 



Au sommaire 

Pourquoi Python? Pour quels usages? • Administration systeme • Prototypage d'application : maquettes d'in- 
terfaces, de bibliotheques • Applications web et de gestion • Installation des environnements d'execution et de 
developpement • Installation sous Linux, MS-Windows et Mac OS X • Tests et scripts de demarrage. Mode 
interactif • Choisir un editeur • Syntaxe • Commentaires • Modeles de donnees • Litteraux • Types et opera- 
teurs • Indentation • Structures conditionnelles : if, for.. in, while • Structures du langage • Fonctions • Contexte 
d'execution • Directives return et global • Docstrings • Classes • Espaces de noms • Heritage • Attributs pri- 
ves • Methodes de comparaison • Method Resolution Order • Constructeur statique • Surcharge de type • 
Slots et decorators • Modules • Import • Reload • Paquets • Exceptions • Listes • Constructeurs et iterateurs • 
Primitives du langage • Exceptions : erreurs et avertissements • Conventions de codage • Blocs et espace- 
ment • Conventions de nommage • Structure d'un module • Choix des noms : longueur, unicite, expressivite • 
Fonctions de la bibliotheque standard • Interaction avec I'interpreteur • Acces au systeme • Utilitaires fichiers • 
Outils de compression • Programmation reseau • Persistance • Conversion, transformation de donnees • Calculs 
numeriques • Structures de donnees • Les modules itertools, re, Tkinter et lib2to3 • Cas pratiques • 
Programmation dirigee par les tests • Tests unitaires et fonctionnels • Unittests, doctests et Coverage • 
Integration d'un projet dans I'environnement • Le futur de PyUnit • Optimisation du code • Profiling • Amelioration 
des performances • Code Patterns, multithreading • Pool, ctypes • Tests de performance en continu • 
Programmation orientee objet • Typage, classification et encapsulation • Heritage et polymorphisme • Relations 
entre objets • Design patterns orientes objet • Singleton et Borg, Observer, Chain of responsability, Proxy... • 
Annexes • Histoire de Python • Bibliotheques tierces • Sites, flux RSS, blogs... 



A qui s'adresse cet ouvrage ? 

- Au developpeur souhaitant s'initier a un nouveau langage et realiser des applications web; 

- Aux developpeurs Python souhaitant aller plus loin dans les bonnes pratiques de developpement [programmation 
orientee objet, performances, tests unitaires...). 
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